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머 리 말 


목적 

이 책에서는 콤퓨터의 구조와 기능에 대하여 서술하였다. 목적은 현대콤퓨터체계들 
의 본질과 특성을 될수록 명백하게 그리고 충분히 주자는데 있다. 

이러한 과제가 제기되게 된것은 다음과 갈은 몇가지 원인과 관련된다. 첫째로，가격 
이 수딸라정 도인 한소편극소형 처 리 소자들로부터 수천만딸라정 도인 슈퍼 콤퓨터 에 이 르기 
까지 《콤퓨터》라고 말할수 있는 제품들이 아주 다양한것이다. 이러한 다양성은 가격뿐 
아니라 크기와 성능，응용의 견지에서도 찾아 볼수 있다. 둘째로，콤퓨터의 속도가 끊임 
없이 계속 높아 지고 있는것이다. 속도가 이렇게 높아 지는것은 콤퓨터요소를 만드는 집 
적회 로기 술로부터 그 요소들을 결합한 병 렬조직개 념의 리용범위 를 확장하는데 이르기 까 
지의 전반적 인 를퓨터기술이 발전한것과 관련된다. 

콤퓨터가 이렇게 다양하고 속도도 서로 다르지만 콤퓨터분야에서는 명백한 기초개념 
들이 시종일관하게 철저히 응용되고 있다. 이 개념들이 어떻게 응용되는가는 현재의 기 
술상태와 설계자가 설정한 가격/성능목표에 관계된다. 이 책의 목적은 콤퓨터조직과 
구성 방식의 기 초를 고찰하고 그것을 오늘날의 를퓨터 설계지 표들과 련관시 키 는것 이 다. 

소제목들에는 이 책에서 취급한 문제들과 고찰방법들이 제시되여 있다. 성능이 높은 
를퓨터체계를 설계하는것은 어느 때나 중요하였지만 지금보다는 이 요구가 결코 높지 않 
았으며 더 어렵지도 않았다. 오늘에 와서는 처리장치의 속도，기억기속도，기억기용량，자 
료의 호상결합속도를 비롯하여 를퓨터체계의 모든 기본성능들이 빨리 개선되고 있다. 그 
리고 이 기본성능들은 발전속도가 각이하다. 이것은 모든 요소들의 성능과 그 리용의 견 
지에서 최대인 체계를 실현하는데서 어려운 문제로 제기되고 있다. 그리하여 콤퓨터설계 
에서는 한 부분에서 성능이 제대로 보장되지 못하는것을 다른 부분에서의 구조와 기능을 
변화시키는 방법으로 보상하려는 시도가 더욱더 늘어 나고 있다. 이 책을 통하여 여러가 
지 설계 방법들을 적용한 수법들을 알수 있다. 

콤퓨터체계는 다른 체계들과 마찬가지로 련관되여 있는 요소들의 묶음으로 구성된다. 
이 체계는 구성부분들을 서로 련결하는 방법인 구조라는 말과 개별적인 구성부분들의 조 
작인 기능이라는 말로 특징 지어 진다. 그리고 콤퓨터조직은 계층적으로 이루어 져 있다. 
매 개 구성부분들은 더 작은 구성부분으로 분해 하고 그것들의 구조와 기능을 설명하는 방 
법으로 서술할수 있다. 명백하면서도 쉽게 리해하도록 하기 위하여 이 책에서는 계층구 
성을 다음과 같이 웃준위로부터 아래준위로 내 려가면서 서술하였다. 

• 콤퓨터체계 : 기본구성부분들은 처 리장치，기억기， I 八) 장치 이 다. 

• 처리장치 : 기본구성부분들은 조종장치，등록기， ALU , 명령실행장치이다. 

• 조종장치 : 기 본구성 은 조종기억 기，마이 크로명 령 순서 조종론리，등록기 이다. 

목적은 이 내용들을 서술함에 있어서 새 내용이 명백한 전후관계속에서 서술되도록 
하는데 있다. 이것은 독자들이 될수록 향방을 잃지 않고 아래로부터 우로 올라 가는 식 
으로 학습하는것 보다 의 욕을 보다 높여 주기 위한것 이 다. 

이 책의 전반에서 체계의 매개 측면들은 구성방식 (체계의 이 측면은 기계어프로그람 
작성 자들에 게 직 관적 인것 이 다. )의 관점 과 조직 (구성 방식 을 련상할수 있게 하는 조작장치 
들과 그것들의 결합)의 관점에서 고찰되고 있다. 
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체계들의 실례 

책에서 취급한 여러 종류의 콤퓨터들에 대한 실례들은 현재 쓰고 있는 개념들을 명 
백히 하거나 보충하는데 러용되였다. 대부분의 실례들은 두개의 콤퓨터계렬 즉 인텔의 
Pentium II 와 PowerPC 로부터 취 하였다 (Pentium 이은 다매 체명 령 들이 확장되 였을뿐 본 
질적 으로는 Pentium II 와 같다. ) . 

이 두 체계들에는 콤퓨터설계의 현재추세들이 대부분 반영되여 있다. Pentium II 는 
본질 적 으로 RISC 중심 의 복합명 령 모임 콤퓨터 ( CISC ) 이 지 만 PowerPC 는 축소명 령 모임 콤 
퓨터 ( RISC ) 이 다. 이 두 체 계 들은 슈퍼 스칼라설 계 원리 들을 리 용하였 으며 둘다 다중처 리 
장치의 구성 방식을 지 원하고 있다. 

본문의 내용구성 

이 책은 5개의 편으로 구성되 였다. 

제 1 편-일반개념: 이 편에서는 이 책의 뒤부분들에 대한 예비적인 고찰과 전후관계를 주 
고 있다. 

제 2 편-콤퓨터체계 : 콤퓨터체계는 처 리장치，기 억기 , I 八)장치들과 이 기본구성부분 
들의 결합들로 이루어 져 있다. 이 편에서는 제 3편에서 고찰하는 아주 복잡한 처 리 장치 
를 제외하고 나머지부분체계들도 고찰하였다. 

제 3 편-중앙처 리 장치 : CPU 는 조종장치 , 등록기 , 산수-론리 연산장치，명 령 실 행 장치 
와 이 구성부분들의 결합으로 이루어 져 있다. 이 편에서는 명령모임설계와 자료형식들 
과 갈은 방식적인 지표들을 고찰한다. 또한 관흐름조종과 갈은 구성지표들도 고찰한다. 

제 4 편-조종장치 : 조종장치 는 처 리 장치 의 여 러 구성 부분들을 동작시키 는 처 리 장치 의 
한 부분이다. 이 편에서는 조종장치의 기능과 마이크로프로그람조종방식을 리용하는 조 
종부의 실현방법을 고찰한다. 

제 5 편-병 렬 처 리 구성 : 마지 막부분에 서 는 다중처 리 장치 와 벡 토르처 리 구성 에 포함되 는 
일부 지표들을 고찰한다. 

장들에 대한 상세한 개괄은 제 1 장의 뒤에서 준다. 

교원들과 대학생들들 위한 인테 dl 트봉사 

이 책에는 교원들과 학생들에게 도움을 주는 Web 싸이트도 소개되여 있다. 이 싸이 
트는 다른 련 관 있 는 싸 이 트들과의 련 결， PDF (Adobe Acrobat ) 형 식 으로 이 책 에 있 는 
모든 그림들의 뚜렷한 원본들, 책의 인터네트전자우편목록과 관련된 서명된 정보를 포함 
하고 있다. 이 Web 폐지는 http ：// www . Shore . net /~ ws / COA 5 e html 이다. 인터네 
트전자우편목록은 이 책을 리용하는 교원들이 호상간 그리고 이 책의 저 자와 정보，제 안， 
질문들을 서로 교환할수 있게 설치되였다. 편집상 혹은 인쇄상 오유들을 발견하는 즉시 
로 http ：// www . Shore . net/~ws 를 찾으면 이 책의 오유목록을 찾아 대조할수 있다. 


많은 교원들에게 있어서 콤퓨터조직과 구성방식과정안의 중요한 부분은 대학생들이 
본문으로부터 개념들을 보다 확고히 알도록 제손으로 체험하게 하는 방식으로 된 교수과 
제 또는 교수과제묶음을 설정하는것이다. 이 책은 과정안집행에서 교수과제의 요소들을 
포함시키도록 하는데 비할바 없는 도움을 준다. 교원들의 지도안에는 교수과제를 배당하 
고 구성하기 위한 지침과 함께 본문의 여러가지 문제를 포괄하는 제안된 교수과제묶음이 
포함되여 야 한다. 

• 연구과제: 지도안에는 대학생들이 Web 혹은 문헌에서 개별적인 제목들을 연구하 
고 보고서를 작성 하도록 가르치는 연구과제들을 포함한다. 

• 모의과제 : 지도안에 는 모의 프로그람인 SimpleScalar 의 리 용과 관련된 지 원을 포함 
한다. SimpleScalar 는 콤퓨터조직과 구성방식설계를 위한 항목들을 탐색하는데 리 
용된 다. 

• 읽기/보고서과제 : 지도안에는 매 장별로 된 참고문헌에 있는 론문들의 목록을 포 
함시키고 대 학생별로 읽도록 과제를 주고 그에 따라 짧은 보고서를 작성하도록 할 
수 있다. 

자세 한것은 부록 II 를 참고하면 된다. 

이 책에서 새로운것은 무엇인가 

이 책의 제 4 판이 출판된 때 로부터 4 년동안에 이 분야에서 는 련속적 인 혁 신과 발전 
이 이룩되였다. 이 책의 새 판에서는 전반적으로는 포괄적인 적용범위를 그대로 유지하 
면서 새 로운 변화들을 더 반영하려 고 시 도하였 다. 이 책 의 수정 보충을 위하여 이 과목을 
배 워 주는 많은 교수들이 이 책의 제 4 관을 전반적 으로 후열 하였다. 결과 여 러 개 소에서 
론의들이 명백해 지고 확고해 졌으며 실례들이 개선되였다. 또한 새로운《부분별 시험》 
문제들이 보충되였다. 

교육자들과 사용자들에 대 한 친절성 을 도모하기 위하여 노력한 결과 이 책 전반이 본 
질적으로 달라 졌다. 장별 구성은 대체적으로 같이 하였지만 수많은 자료들이 수정되고 
새로운 자료들이 첨부되였다. 가장 중요한 변화는 다음과 같다. 

• 빛기 억기 : 빛기 억기에 대한 자료에는 자기광학식빛기 억장치들을 더 포함시켰다. 

• 슈퍼 스칼라설계 : 슈퍼스칼라설계 에 대 한 장에 는 더 상세한 론의 와 두개 의 새 로운 
모형 즉 UltraSpare II 와 MIPS R10000 을 포함시 켰 다. 

• 다매 체명 령 모임 : Pentium II 와 Pentium in 에 서 리 용되 는 MMX 명 령 모임 이 소개 되 
였 다. 

• 예견적인 실행과 리론상의 과제 : 이 판에서는 Intel 과 Hewlett-Packard 로부터 새 
토운 IA-64 구성 방식 의 설 계 에 서 중심 인 새 로운 개 념 들에 대 하여 론의 하였 다. 

• SUPS , clusters , NUMA 체계 : 병렬조직에 대한 장은 완전히 수정되였다. 그것은 
대 칭 다중처 리 장치 체 계 들 (SMPs) , 집 합콤퓨터，비 균일 기 억 기 호출체 계 (NUMA) 들에 
대 한 비 교와 상세한 서 술들을 새 롭게 포함하였 다. 

• 확장된 지도서지원: 이미 언급하였지만 이 책에서는 새로운 계획을 위한 확장된 지 
원을 제공하였다. 이 책에서 제공된 Web 싸이트지원 역시 확장된것이다. 
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제 1 편. 일반개념 


제 1 편의 중심 

제 1 편에서는 이 책의 뒤부분에 대한 지식과 내용을 준다. 다시말하여 콤퓨터조직과 
구성방식의 기본개념을 준다. 

제 1 편의 장별 내용 

제 1 장. 안내 

제 1 장에서는 계층체계로서 콤퓨터의 개념을 준다. 를퓨터는 부분적요소들의 구조로 
고찰할수 있으며 그의 기능은 서로 결합하고 있는 구성요소들의 집체적인 기능으로 표현 
된다. 매개 구성요소들은 내부구조로 표시된다. 이 장에서는 이 계층적고찰의 기본준위들 
을 소개 하였다. 책의 뒤부분은 우에서부터 아래까지의 이 준위들로 편성되였다. 

제 2 장 콤퓨터의 발전과 성능 

제 2장에 서 는 기 계적 장치 들로부터 현재 체 계 까지 의 콤퓨터들의 간단한 발전력 사를 주 
었다. 이 력사에서는 일부 중요한 콤퓨터설계특성을 강조하며 콤퓨터구조의 높은 준위를 
고찰한다. 이 장에서는 기본주제로서 성능에 대한 설계를 고찰한다. 그러고 성능특성이 
크게 차이 나는 구성부분을 리용하는 경우 균형을 맞추는것의 중요성을 강조한다. 


제 1 장. 소개 
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♦ 콤퓨터체계의 기 본구성요소들은 CPU , 주기 억 기 , I 八) 보조체 계 이며 일부 이 모든 구 
성 부분들의 호상접 속이다. 그리 고 CPU 는 조종장치，산수-론리연산장치，내 부등록 
기 그리고 이것들의 호상간 접속기구들로 구성된다. 

♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦ 


제 1 절. 조직과 구성방식 

콤퓨터체 계서 술에서는 콤퓨터 구성 방식 파 콤퓨터조직 사이 의 차이를 똑똑히 갈라 놓 
아야 한다. 이 용어들의 정확한 정의를 주기는 어렵지만 각기 포괄하는 일반적령역에 대 
하여서는 공통된 견해 가 있다 ([ VRAN 80], [ SIEW 8 幻， [ BELL 78 a ] 참고) . 

콤퓨터구성방식이란 프로그람작성자의 견지에서 본 체계의 속성 혹은 프로그람의 론 
리 적 실 행 에 직 접 적 영 향을 미 치 는 속성 을 말한다. 콤퓨터 조직 이 란 구성 방식 지 표들을 실 현 
하는 연산장치 들과 그것들의 호상접속을 말한다. 구성 방식 적속성 들의 실례 는 명 령모임， 
여 러 가지 형식 (실례로 수자，문자)의 자료들을 표현하는데 리용되는 비트의 길이， I 八)장 
치 그리고 기 억기주소화기술들이다. 구성적속성들은 프로그람작성 자에게 명백히 구별되 
는 하드웨어세부장치들 즉 조종신호, 콤퓨터와 주변장치사이의 대면부 그리고 리용되는 
기 억 기 기 술과 같은것 들이 다. 

실례로 콤퓨터가 곱하기명령을 가질것을 방식적설계계획으로 한다고 하자. 이때 전 
용곱하기장치로 혹은 체계의 더하기장치를 반복적으로 리용하는 기구로 실현하는 구성계 
획을 세울수 있다. 이것을 어떻게 구성하겠는가 하는 결심채택은 곱하기명령리용에 예견 
된 주파수，두 방법 의 상대 적 속도, 가격，전용곱하기장치 의 물리 적 크기 에 기 초한다. 

력사적으로 그리고 오늘까지 구성방식과 조직사이의 구별은 중요한 문제로 되고 있 
다. 많은 콤퓨터제작자들은 모두가 구성 방식은 갈지만 조직 이 서 로 다른 여 러가지 계렬 
의 콤퓨터형들을 내놓고 있다. 그렇기때문에 계렬내의 서로 다른 형들은 서로 다른 가격 
과 성능특성들을 가진다. 그러므로 구성방식은 오래동안 유지되고 있지만 그 조직은 기 
술변화에 따라 변화된다. 이 두 현상의 적절한 실례 로는 IBM System /370 구성 방식 이 다. 
이 방식은 1970 년에 처음으로 소개되여 형번호에 이 년도를 포함시켰다. 구매자들은 요 
구에 따라 눅고 속도가 뜬 형을 살수 있었으며 만일 요구가 더 높아 지면 후에 이미 개 
발된 프로그람을 버러지 않고도 더 비싼 비용으로 더 빠른 형으로 갱신할수 있었다. 그 
후 IBM 은 낡은 기 술을 교체하여 개 선된 기 술로 구매 자들에 게 보다 속도가 높고 가격 이 
눅은 새 로운 형 을 소개하였 다. 이 새 로운 형 의 콤퓨터 는 갈은 구성 방식 을 유지 함으로써 
구매 자들이 쏘 프트웨 어 를 구입하는데 비 용을 새 로 지 출하지 않게 하였 다. 주목되 는것 은 
SYSTEM /370 구성방식 이 약간씩 강화되면서도 오늘까지도 IBM 의 대형 콤퓨터 생산흐름 
선의 구성 방식을 그대로 유지하고 있는것 이 다. 

극소형를퓨터체 계 에서 구성 방식과 조직사이 에는 대 단히 밀접한 관계 가 있다. 기술의 
변화는 조직 에 만 영 향을 미치 는것 이 아니 라 더 위 력 하고 더 풍부한 구성 방식 들이 나오게 
하는데도 영향을 미치였다. 일반적으로 이 소형콤퓨터들에 있어서는 세대 에 따르는 호환 
성의 요구가 적다. 그러므로 조직과 구성방식사이에는 설계결심채택에서 보다 호상영향 
이 크다. 흥미 있는 실례 는 제 12 장에서 설명하는 축소명 령 모임콤퓨터 ( RISC ) 이 다. 

이 책 에 서 는 콤퓨터 조직 과 콤퓨터 구성 방식 을 설명 하였 다. 중점 은 구성 측면에 두었 다. 
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그러나 콤퓨터조직이 특정 한 구성방식지표의 실현을 위해서 설계되는것만큼 콤퓨터조직 
을 철저히 고찰하는것은 역시 구성방식에 대한 자세한 고찰도 동반할것을 요구한다. 


제 2 절. 구조와 기능 

콤퓨터는 복합체계이다. 즉 현 시대 콤퓨터들은 요소적인 수백만개의 전자부분품들 
을 포함한다. 그러면 어떻게 그것들을 명백히 서술할수 있겠는가. 기본문제는 를퓨터를 
포함하는 대 부분 복합체계 의 계 층적 본질 을 식 별 하는것 이 다 [ SIM 069 t 계 층체 계 는 서 로 
련관된 보조체 계 들의 묶음이다. 

복합체계의 계층성은 그것들에 대한 설계와 서술에 있어서 가장 중요하다. 설계자는 
한번에 체계를 특수한 준위들로 분할할것을 요구한다. 매 준위에서 체계는 구성부분들과 
그것들의 호상결합들로 이루어 진다. 매 준위에서의 동작은 다음의 낮은 준위의 단순하 
고 추상적인 성질에 의존한다. 설계자는 매 준위에서 구조와 기능에 관심을 돌린다. 

• 구조 : 구성부분들을 호상 련관시키는 방법 

• 기능 : 구성부분으로서의 개별적인 구성요소의 연산기능 

계층을 서술할 때에는 제일 아래준위로부터 시작하여 체계를 구축하는 방법과 웃준 
위로부터 고찰하여 보조적인 부분들로 체계를 분해하는 두가지 방법을 선택한다. 여러가 
지 론의로부터 우에서부터 아래 로의 방법 이 가장 명백 하고 효과적 이 라는것을 알수 있다 
[ WEIN 75]. 

이 책에서 취급한 방법은 이 고찰에 따른다. 콤퓨터체계는 우에서부터 아래로의 방 
향으로 서술된다. 이 책에서는 기본구성부분들로부터 시작하여 구조와 기능을 제일 낮은 
계층까지 서술하였다. 이 절의 뒤부분에서는 이 방법을 아주 간단히 고찰하였다. 

1 • 기능 

콤퓨터의 구조와 기능화는 실제로 간단하다. 

그림 1-1 에서는 콤퓨터 가 실행할수 있는 기 본기 
능을 보여 주었다. 일반적 인 용어로는 다음의 4 
가지가 있다. 

• 자료처리 

• 자료기억 

• 자료전송 

• 조종 

물론 콤퓨터 는 자료를 처 리할수 있 어 야 한다. 

자료는 형식이 매우 다양하며 처리요구의 범위 
가 넓다. 그러 나 자료처 리에는 몇 가지 기초적방 
법 혹은 형식이 있을뿐이다. 

또한 를퓨터 는 반드시 자료를 기 억하여 야 한 
다. 만일 를퓨터가 가동상태에서 자료를 처 리하 
고 있다면 콤퓨터는 임의의 주어 진 순간에 처 
리되고 있는 중간결과들을 림시적으로 기억하여 
야 한다. 따라서 림시적인 자료기억기능이 있어 


조작환경 

(자료의 원천과 목적) 
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야 한다. 마찬가지로 중요한것은 를퓨터가 오랜 기 간 자료기 억기능을 수행 하여 야 한다는 
것이다. 자료파일들은 후에 수정하고 갱신하기 위하여 를퓨터에 기억된다. 



그림 1-2. 가능한 콤퓨터조작 


콤퓨터는 자기자신과 다른 모든 장치들사이에 자료를 전송할수 있어 야 한다. 를퓨터 
의 연산환경은 자료의 출발지 나 목적지 에 봉사하는 장치들로 구성된다. 자료가 콤퓨터 에 
직 접 련결된 장치 로부터 수신되 거 나 송신되 는 과정 을 입 출력 (I 八))이 라고 하며 이 장치 
를 주변장치라고 한다. 자료가 원격 장치로부터 또는 원격장치까지 먼 거 리를 이동할 때 
의 과정을 자료통신이라고 한다. 

마지막으로 이 3 가지 기능들을 조종하여 야 한다. 결국 이 조종은 명 령 으로 콤퓨터를 
동작시키는 개체들에 의하여 실현된다. 콤퓨터체계 내에서 조종장치는 콤퓨터의 자원을 
관리하며 명 령 들에 대 응하는 기 능적 부분들의 성 능을 규정한다. 

일반적 인 준위에 대 한 론의 에서처 럼 가능한 조작의 수는 매우 적 다. 그림 1-2 에서는 
가능한 조작의 4 가지 형태를 그림으로 묘사하였다. 콤퓨터는 단순히 어떤 주변장치로부 
터 혹은 통신선로로부터 다른 장치 에 로 자료를 전송하는 전송장치 로서 의 기 능을 수행할수 
있다(그림 1-2 1). 또는 외부장치들로부터 콤퓨터에 전송된 자료를 기억하고 반대로 기 
억 된 자료를 콤퓨터 로부터 외 부장치 에 로 출력하는 자료기 억 기 로서 의 기 능을 수행할수 있 
다(그림 1-2 l ). 마지 막두개 의 그림 은 기 억 장치 로부터 의 자료에 대 하여 (그림 1-2 n ) 혹 
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은 기억장치와 외부장치들사이에서의 자료에 대한(그림 1-2 8；) 자료처리를 포함하는 조 
작들을 보여 준다. 

우에 서 진행한 론의 는 불합리하게 개 괄된듯 하다. 콤퓨터 구조의 웃준위 에 서 다양한 
기능들을 구별하는데는 확실히 가능하지만 [ SIEW 8 幻에서 인용한 다음의 문장에서는 그 
렇지 않다. 즉 수행되는 기능을 적합하게 하는 주목할 정도로 작은 형태의 콤퓨터구조가 
있다. 이 근거에는 모든 기능적인 제한이 프로그람작성시간에 관계되며 설계시간에는 무 
관계한 콤퓨터 의 일 반적 인 본질 이 놓여 있 다. 

2. 구조 

그림 1-3 은 콤퓨터를 가장 단순하게 묘사한것 이 다. 콤퓨터는 외부장치와 어떤 규 
약으로 서로 작용하는 실체이다. 일반적으로 외부장치에 대한 결합의 전부는 주변장 
치와 통신선로로 나눌수 있다. 여기서는 이 두가지 결합형태를 고찰한다. 

그러나 이 책에서 크게 관계되는것은 그림 1-4 에서 높은 준위로 보여 준 를퓨터 
자체 의 내 부구조이 다. 를퓨터는 4개의 기본구성부분을 가진다. 

• 중앙처리장치 ( CPU ): 콤퓨터의 연산을 조종하거나 그의 자료처리기능을 수행한다. 흔 

히 간단하게 처리장치라고도 한다. 

• 주기억 기 : 자료를 기 억 한다. 

• I 八3 : 콤퓨터 와 외부장치 사이 에 자료를 전송 

한다. 

• 체 계 호상결 합: CPU , 주기 억 기, I/O 들사이 에 통 

신을 제공하는 기구들 

콤퓨터에는 이 구성부분들이 하나이상 있어야 
한다. 전통적으로 콤퓨터는 한개의 CPU 를 가진 
다. 최근에는 단일체계에서 다중처리장치들이 많 
이 리용되고 있다. 그림 !_ 3 , 콤퓨터 

다중처 리 장치 와 관련된 일부 설 계 계 획 들을 뚜렷 하 
게 찾아 볼수 있으며 이와 같은 체 계는 제 16 장에서 취급한다.이 개별적 인 구성부분들 
은 제 2 편에서 구체 적 으로 설명한다. 그러 나 가장 흥미 있고 가장 복잡한 구성부분인 
CPU 의 구조를 그림 1-5 에 주었 다. CPU 의 기 본구조적 구성 부분은 다음과 같다. 

• 조종장치 : CPU 연산을 조종하며 더 나아가서 콤퓨터 를 조종한다. 

• 산수론리 연산장치 : 콤퓨터의 자료처리기능을 수행 한다. 

• 등록기 : CPU 에 서 내 부적 기 억 을 진행 한다. 

• CPU 호상결 합 : 조종장치 , ALU 등록기 들사이 에 통신을 보장하는 기 구들이 다. 

이 구성 부분들의 개 별 적 요소들에 대 해 서 는 제 3 편 에 서 상세 하게 설 명 하였 다. 조종장 
치 의 실현을 위한 여 러 가지 방법 이 있지 만 가장 일 반적 인것은 마이 크로프로그람조종방식 
으로 실현하는것이다. 이 방법에서 조종장치의 구조는 그림 1-6 에서처럼 주어 질수 있다. 
이 구조는 제4편에 서 취 급한다. 
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그림 1-4. 콤퓨터의 높은 준위구조 
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제 3 절. 책의 개요 


이 절에서는 책의 전반내용을 소개한다. 뒤에서 취급하는 장들의 간단한 개요는 다음과 
같다. 

콤퓨터의 발전과 성능 

제 2 장은 두가지 내 용을 담고 있 다. 첫째 로，콤퓨터 조직 과 구성 방식 의 기 본개 념 을 소 
개하는 흥미 있는 콤퓨터 의 발전력 사이 다. 둘째 로，성 능을 높이 기 위한 성 공적 인 콤퓨터 
체 계의 설계요점들에 대 한 기술발전추세와 균형，효률적 인 성능을 달성 하기 위하여 리 용 
되는 여 러가지 기술과 전략을 미 리 고찰하는것 이 다. 

체계모선 

제 일 웃준위 에서 콤퓨터 는 처 리 장치，기 억 기， I/O 구성 부분들로 구성 된다. 콤퓨터 의 
기능적인 동작은 구성부분들사이의 자료와 조종신호들의 교환으로 이루어 진다. 자료교 
환을 실현하기 위 하여서는 이 구성부분들이 서 로 련결되 여 야 한다. 제 3 장에서는 콤퓨터 
의 구성부분들과 입출력요구들에 대하여 간단히 설명하였다. 호상결합설계에 영향을 미 
치는 관건적문제들과 새치기를 실현하기 위한 요구들을 고찰하였다. 이 장의 기본은 모 
선구조의 리용과 같은 호상결합에 대한 가장 일반적 인 방법을 학습하는것 이 다. 

내부기억기 

콤퓨터기억기는 형태，기술，구성，성능，가격의 넓은 범위를 포괄한다. 일반적 인 콤 
퓨터체계는 일부 내부기 억기 (처 리 장치 에 의하여 직접 호출가능한기억기)와 일부 외부기 
억 기 (처 리 장치 가 I/O 모둘을 통하여 호출하는 기 억 기 ) 와 같은 기 억 기 보조체 계 들의 계 층 
으로 구성된다. 제 4 장에서는 이 계층과 내부기 억기 에 관계되는 설계의 요점들에 대 하여 
고찰하였다. 우선 반도체주기억기의 본질과 구성 이 설명되 고 다음으로 명 령캐쉬와 자료 
캐쉬의 분할방식과 그 준위캐쉬를 포함한 캐쉬기억기설계의 상세한 내용을 주었다. 마지 
막부분에 서 최 근 개 량된 DRAM 기 억 기 구성 들을 소개하였 다. 

외부기억기 

제 5장에 서 는 자기 디 스크기 억기와 관련된 여러 가지 설계와 성 능지 표들을 설 명 하였 다. 
그리고 점 차 일 반화되 고 있 는 RAID 방식 을 설 명하였 다. 또한 빛 기 억 기 와 자기 테 프체 계 
를 설 명하였 다. 

입출력 

I/O 모둘은 처 리장치와 기 억기 그리고 매 개 조종장치들 혹은 대부분 외부장치들과 서로 
련결된다. 제 6 장에서는 프로그람식 I/O 조종방식, 새치기 I/O 조종방식, 직접기억기접근 
( DMA ) 조종방식의 기술을 리용하여 I/O 모둘이 콤퓨터체계를 안정하게 서로 작용할수 있는 
기구들에 대 하여 고찰하였 다. 그리 고 " O 모둘과 외부장치 들사이의 결합방식 을 서 술하였다. 
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조작체계지원 

이 문제에서는 기본콤퓨터구성부분들이 효과적인 작업을 수행하기 위하여 어떻게 관 
리 되며 콤퓨터 장치 가 조작체 계지 원을 제 공하기 위 하여 어떻 게 구성 되 는가를 설명 하기 위 
하여 조작체 계 를 기 본으로 고찰한다. 제 7장은 조작체 계 들의 기 본형 태 들을 일 치 시 키 고 그 
것들을 사용하게 된 간단한 력사로부터 시작한다. 그다음 다중프로그람방식을 긴시 간일 
정 작성과 짧은시 간일정 작성 기능을 조사하는것 으로 설명한다. 끝으로 기 억기관리에서는 
토막화，페 지 화，가상기 억 기 를 론의한다. 

콤퓨터산수연산 

제8장에서는 콤퓨터산수연산의 론의 로서 처 리 장치를 상세히 고찰한다. 처 리 장치들은 
일반적으로 옹근수 혹은 고점수와 류점수의 두가지 형태를 제공하고 있다. 두 경우에 대 
하여 여 기서는 처 음에 수들의 표현을 고찰하고 그다음 산수연산방식 을 론의한다. 또한 
중요한 IEEE 754 류점 수의 표준화를 상세 히 고찰한다. 

명령모임 

프로그람작성 자의 견지 에 서 처 리 장치 의 연산을 리 해하는 가장 좋은 방법 은 처 리 장치 
가 실 행 하는 기 계 어 명 령 모임 을 배 우는것 이 다. 제 9 장에 서 는 기 계 어 명 령 모임 들의 기 본특성 
들을 고찰한다. 처 리장치는 명령모임에서 찾아 볼수 있는 여러가지 자료형식과 연산형태 
들을 수행할수 있게 구성 된 다. 다음으로 기 호언어 와 처 리 소자명 령 들사이 의 관계 를 간단 
히 설명하였다. 제 10 장에서는 가능한 주소화방식들이 소개되였으며 또한 상품화의 내용 
들을 포함하여 명 령형식의 지표들을 소개하였다. 

CPU 구조와 기능 

제 11 장에서는 처 리장치의 내부구조와 기능에 대한 내용을 주었다. 전반적 인 구성 
( ALU , 조종부，등록기파일)이 다시 고찰된다. 다음으로 등록기파일의 구성 이 론의된다. 
이 장의 뒤부분에서 기계 어명 령을 실행 하기 위한 처 리 장치의 기 능화를 서술한다. 명 령주 
기는 명령꺼내기，간접처리，실행，새치기주기들의 기능과 호상련관을 고찰한다. 마지막 
으로 성 능을 높이 기 위한 관흐름조종의 리 용을 상세 히 소개한다. 

축소명령모임콤퓨터 

최 근에 콤퓨터 조직과 구성 방식 에서 가장 큰 혁 신은 축소명 령 모임 콤퓨터 ( RISC ) 방식 
이 다. RISC 구성 방식 은 처 리 소자방식 에 서 력 사적 추세 로부터 의 극적 인 새 로운 발전 이 다. 
이 연구방법에 대한 해석은 를퓨터조직과 구성방식에서 중요한 대부분의 지표들을 대상 
으로 하여 진행된다. 제 12 장에서는 RISC 방식을 기본으로 하고 복합명령모임를퓨터 
( CISC ) 방식과 비교한다. 

명령준우 I 병렬화와 슈퍼스칼라처리장치 

제 13 장에서는 가장 최근까지도 중요한 설계혁신이라고 하는 슈퍼스칼라처리장치를 
고찰한다. 비 록 슈퍼 스칼라기 술이 임 의 의 처 리 장치 에 서 리 용될 수 있지 만 RISC 방식 에 특 
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별히 더 적 합하다. 또한 명 령준위 병 렬화의 일반적 인 지표들을 고찰한다. 


조종부연산 

제 14 장에서는 처 리 장치기 술들이 조종부의 기 구들에 의하여 어떻 게 수행되며 더 특 
수하게 처 리 장치의 여 러 구성부분들이 이 기능들을 수행 하기 위 하여 어떻게 조종되는가 
에 대 하여 론의한다. 매 개 명 령 주기 는 조종신호들을 형 성하는 마이 크로연산묶음의 조합 
이 다. 실행 은 조종장치 로부터 ALU , 등록기，체계 호상결합구조까지 출력되는 조종신호들 
의 작용으로 완료된다. 끝으로 장치 적 실현에 의한 조종부의 실현방법 을 주었 다. 

마이크로프로그람조종방식 

제 15 장에서는 조종부가 마이크로프로그람방식의 기술을 리용하여 어떻게 실현되는 
가를 보여 준다. 우선 마이크로조작들은 마이크로명령으로 배렬된다. 그다음 매개 기계어 
명 령을 위한 마이크로프로그람을 포함하고 있는 조종기억기설계방안을 서술하였다. 또한 
마이 크로프로그람방식 의 조종부구조와 기 능을 설 명하였 다. 

병렬처리 

전통적으로 콤퓨터는 순서기계로 고찰되여 왔다. 콤퓨터기술이 발전되고 를퓨터장치 
의 가격 이 눅어 짐 에 따라 콤퓨터 설계 가들은 보통 성 능을 높이 고 믿 음성 을 높이 기 위하 
여 점차적으로 병렬처 리방법들을 연구하고 있다. 제 16 장은 병렬처리조직을 위한 여러가 
지 방법들을 보여 준다. 또한 다중처 리 장치방식을 위하여 캐쉬일치성의 기본설계지표를 
고찰한다. 

수자론리 

이 책 에서 기본은 콤퓨터체계의 기초적 인 블로크들로서 2 진기억요소와 수자기능들 
을 취급한다. 이 책의 부록은 이 기억요소들과 기능들이 수자론리로 어떻게 실현되는가 
를 서술하였다. 다음으로 문의 개념을 소개하였다. 마지막으로 문들로부터 구성되는 조합 
회 로와 순서 회 로들을 론의하였 다. 

제 4 절. 인테 II 트 및 Web 자원 

이 책에는 이 분야를 계속 발전시키는데 도움을 주는 인터네트와 여러가지 Web 자 
원들이 있다. 


이 책의 Web 싸이트 

이 책에 지적된 Web 페지는 h 竹 p :// www . shore . net /~ ws / COA 5 eJitml 에 설 치 
하였다. 

이 Web 싸이트에 대한 구체적 인것은 이 책의 앞부분을 보면 된다. 

즉시로 임의의 편집이나 다른 오유들을 발견하면 이 책의 오유목록은 
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http :// www . shore . net/~ws 에서 볼수 있다. 이 파일들은 요구대로 갱신될수 있다. 
ws @ shore_net 에 반점을 찍어서 임의의 오유를 전자우편으로 보여 주어야 한다. 다른 
책들에 대한 고침표들은 참작순서정보와 같이 Web 싸이트에 있다. 

다른 Web 싸이트 

이 책의 제목들과 관련된 일부 짧은 정보들을 제공하는 여러가지 Web 싸이트들이 
있다. 보조장들에서 지적된 Web 사이트들에 대한 지적자들은 {참고문헌}에서 찾아 볼수 
있 다. Web 싸이 트들에 대 한 URL 들은 자주 변하는 경 향성 을 가지므로 이 책 에 그것 들 
을 포함하지 않는다. 이 책에서 소개된 전체 Web 싸이트들에 대하여 해당한 관련부분들 
은 이 책의 Web 싸이트에서 찾을수 있다. 

다음의것 들은 콤퓨터 조직 과 구성 방식 과 관련하여 일 반적 으로 흥미 를 가지는 Web 싸 
이트들이 다. 

• WWW Computer Architecture Home Page ： 를퓨터구성방식그룹들과 계획，구 
성 기 술，문헌과 사용방법，상업 적정 보들을 포함하는 콤퓨터구성 방식연구자들과 관 
련된 정보들에 대한 포괄적 인 색 인 

• CPU Info Center ： 기술적론문，제품정보，제일 마지막으로 발표된 번호를 포함하 
는 특수한 처 리 장치 들의 정 보 

• ACM Special Interest Group On Cputer Architecture : SIGARCH 활용들과 발 
표에 대한 정보 

• IEEE Technical Committee on Cputer Architecture : TCAA 에 시사통보의 복사 

• Intel Technology Journal ： 인텔의 직결발표 

USENET 새로운 그룹 

여 러 USENET 그룹들은 콤퓨터조직과 구성 방식의 몇 가지 형 태를 위하여 노력 하고 
있다. 실제 로 모든 USENET 그룹들에 있어서 신호 대 잡음비 가 높으나 요구를 만족시 킨 
다면 실험할 가치가 있다. 기본적으로 관련되는것은 다음과 같다. 

• Comp. Arch ： 를퓨터구성방식의 론의를 위한 일반적인 그를. 흔히 좋게 평과됨 

• Comp. Arch arithmetic ： 를퓨터산수연산알고리듬과 표준화들의 론의 

• Comp. Arch storage ： 기술적 인 문제들로부터 실제적 인 사용지표들에 이르기까 
지 범위들을 론의 
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제 2 장. 콤퓨터의 발전과 성능 


1975 1980 1985 


♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦ 

♦ 콤퓨터 가 얼마나 발전하겠는가는 처 리 장치속도가 얼마나 빠르고 구성부분크기가 어 
느 정도 작으며 또 기 억용량이 얼마나 크고 I 八) 능력과 속도가 얼마나 높은가에 의 
해 특징 지어 진다. 

♦ 처리장치의 속도를 높이는데 관계되는 요인의 하나는 극소형처리장치의 구성부분들 
사이의 거리이다. 즉 요소들사이의 거리가 짧아 지면 결국 속도가 높아 진다. 그러 
나 최 근년간 속도에 서의 실제 적 인 러득은 관흐름조종을 확고히 리용하고 앞의 명 령 
의 림시적실행결과로 나타나는 펼수적인 투기명령기술을 리용하는 처리장치의 구성 
과 관련된다. 이 모든 기술에 의하여 처 리 장치 가 항시적 으로 동작하도록 설계된다. 

♦ 콤퓨터 체 계설계 에 서 중요한것 은 한 부분의 성 능을 높였을 때 다른 부분의 지 연으로 
인 한 장애 를 없 애 기 위 하여 여 러 가지 구성 부분들의 성 능의 균형 을 유지 하는것 이 다. 
특히 처리장치속도는 기억기접근속도보다 더 빨러 증가한다. 이 불균형적인 구성을 
균형 화하기 위하여 캐쉬의 리용，기 억 기 로부터 처 리장치 까지의 넓은 자료통로의 리 
용，더 리상적 인 기 억기소편의 리용과 갈은 다양한 기술을 적용한다. 

♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦ 


콤퓨터의 간단한 력사를 보기 로 하자. 콤퓨터력사는 그자체가 흥미 있으며 콤퓨터구 
성과 기능에 대 한 고찰방법을 준다. 다음으로 성능지표들을 론의한다. 이 책 에서는 콤퓨 
터 자원들을 균형적으로 리용하는데 필요한 요구를 충분히 서술하였다. 끝으로 Pentium 
과 PowerPC 를 기 본실례 로 두 체 계의 발전과정 을 간단히 보여 준다. 
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제 1 절. 콤퓨터의 간단한 력사 

1. 제 1 세대: 전자관식콤퓨터 

ENIAC (Electronic Numerical Integrator And Computer) 

펜실바니 아종합대 학의 튼 프레 스퍼 에커 트와 존 머 클리 에 의하여 설계 되 고 그들의 
감독밑 에 제 작된 ENIAC 는 세 계 에 서 첫 전자관식 수자콤퓨터 였 다. 

개 발계 획은 전시의 요구들에 대 응한것이 였 다. 새 로운 무기 의 개 발방향과 탄도표에 
대하여 책임지고 있는 대리소인 미군탄도학연구소 ( BRL ) 는 제한된 시간내에 이 표들을 
정확하게 확증하기가 매우 곤난했다. 이 발사표들이 없으면 포수들에게는 새로운 무기 
와 대포들이 쓸모 없었다. BRL 은 탁상형수산기를 리용하는 200명 이상의 성원들을 채용 
하여 필요한 탄도방정식을 풀었다. 한개의 무기에 대한 표를 준비하자면 한사람이 여 러 
날동안에 많은 시 간을 소비하여 야 하였 다. 

펜 실바니 아종합대 학의 전자공학 교수인 머 클리 와 그의 졸업 반 학생 인 에커 트는 
BRL 에 응용할수 있는 전자관을 리 용한 범 용콤퓨터 를 제 작할것 을 계 획 하였 다. 1943년에 
군부에서 이 제 안을 받아 들였으며 ENIAC 로 작업 이 시작되였다. 만들어 진 콤퓨터는 
30 t 의 질 량과 15,000 평 방피 트의 면적 을 차지하며 18000 개 이 상의 전자관을 가진 대 단히 
큰 기계였다. 연산할 때 140 KW 의 전력을 소비하였다. 또한 이미 있던 전자기계식를퓨 
터 보다 연산속도가 근본적 으로 빠르며 초당 5000회 의 더 하기연산능력 을 가지 고 있 었 다. 

ENIAC 는 2 진수콤퓨터 가 아니 라 10진수를퓨터 이 다. 즉 수들은 10진수형 식 으로 표 
현되며 산수연산은 10진수체계로 수행된다. 기 억기는 20개의 축적기로 구성되 였으며 그 
매 개는 10 개의 10 진수자리 를 등록할수 있다. 매 수자는 10 개의 전자관의 직 렬련결에 
의하여 표현된다. 임의의 시간에 한개의 전자관이 ON 상태에 있으면 10 개의 수자중 하 
나를 표현한다. ENIAC 의 기 본결함은 스위 치 를 설정 하여 케 블을 련결，차단하면서 수동 
으로 프로그람을 작성하는것 이 다. 

ENIAC 는 1946 년에 완성되였으며 2 차대전에서 효력을 내기에는 너무 늦었다. 대 
신에 첫 과제 는 수소탄의 가능성 을 측정 하기 위한 복잡한 계 산들을 실 행하는것이 였 다. 
ENIAC 는 그것 이 해 체될 때 인 1955 년까지 BRL 의 관리 하에 연산을 계속하였 다. 

폰 노이만형콤퓨터 

ENIAC 를 위한 프로그람입력과 변환작업은 매우 오랜시간이 걸렸다. 만일 프로그 
탐이 자료와 나란히 기억기에 기억될수 있는 적당한 형식으로 표현될수 있다면 프로그람 
작성과정이 쉬울것이다. 그리고 를퓨터는 기억기로부터 그것들을 읽는것으로 명령을 얻 
을것 이 며 프로그람은 기 억 기 의 위 치 값을 설정 하는것 으로서 설정 되 고 변환될것 이 다. 

프로그람기억식개념으로 알려 진 이 구상은 일반적으로 ENIAC 설계 자들에 의하여 
시 작되 였 으며 가장 명 백하게 는 ENIAC 제 작시 에 고문이 였 던 존 폰 노이 만에 의하여 개 발 
되 였 다. 또한 이 구상은 튜링 에 의하여 갈은 시 각에 개 발되 였 다. 구상은 새 로운 콤퓨터 
EDVAC 를 위하여 노이 만이 1945 년에 처 음으로 발표하였 다. 

1946 년에 노이만과 동업자들은 IAS 콤퓨터라는 새로운 프로그람기억식콤퓨터의 설 
계 를 시 작하였다. IAS 콤퓨터 는 1952 년까지 완성되지 못하였지만 그후의 모든 범 용콤퓨 
터들의 원형으로 되였다. 
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그림 2-1. IAS 를퓨터의 구성 


그림 2-1 은 IAS 콤퓨터의 일반구 
조를 보여 준다. 콤퓨터는 다음과 같 
이 구성되였다. 

• 주기 억 기 : 자료와 명 령 을 기 억 한 

다. 

• 산수-론리연산부 ( ALU ) : 2진자 
료에 대 한 연산을 수행한다. 

• 조종부: 기억기로부터의 명령을 
해 석 하고 그것 들을 실 행하도록 
한다. 

• I 八)장치:조종부에 의하여 조 
작된 다. 

이 구조는 일찌기 노이만의 제안으로부터 나왔는데 여기서 간단히 인용하겠다 
[ VONN 45]. 

2.2 첫째로，장치는 기본상 계산기이므로 자주 산수적인 기본연산을 수행하여야 할것이다. 이것 
들은 더 하기，덜기 , 곱하기 , 나누기 이다. 그러므로 이 연산들을 위 한 특수한 기구들을 포함하여 
야 하는것은 응당하다. 그러나 이 연산들에 대한 원려는 일반적으로만 알려 져 있으며 관련되는 
특수한 방법 들을 더 정밀하게 조사할것을 요구한다. 적 어도 중앙산수연산부분이 존재하여 야 할 
것이며 이것은 첫번째로 지적된 부분인 CA 를 구성한다. 

2.3 둘째로，장치의 론리적인 조종 즉 연산의 알맞는 순서화는 중앙조종장치구성에 의해서만 수 
행될수 있다. 장치 가 융통성 이 있다면 즉 모든 목적 에 될수록 밀접하다면 구별은 개 별적 인 문제 
를 정의 하고 해 결하기 위하여 지적되는 명 령 들과 이 명 령들을 수행 한다고 볼수 있는 일 반적 인 
조종기구들사이에 이루어 진다. 명령들은 몇가지 방법으로 기억되여야 한다. 조종장치들은 장치 
의 일정한 조작부분에 의 하여 표현되 여 야 한다. 중앙조종장치 는 이 조종장치 의 기 능뿐아니 라 두 
번째 로 지 적된 부분 CC 를 수행하도록 하는 기구를 의미한다. 

2.4 셋째 로，길고 복잡한 조작(계산의 특수성)들의 렬을 수행하는 장치는 상당한 기 억기를 가져 
야 한다. 

( b ) 복잡하게 얽힌 문제를 해결하는 명령들은 특히 코드가 세부적 이라면 상당한 기능적 인 명령 
들로 이루어 져야 한다. 이 기능적인 명령은 기억되여야 한다. 

적어도 모든 기억기는 셋째로 지적된 장치부분 M 으로 구성된다. 

2.6 CA , CC , M 으로 지적된 3개의 부분들은 인간의 신경계통과 관련되는 신경세포에 대응된다. 
그것 은 감각이 나 신경，운동신경 이 나 배 출하는 신경세 포의 동등성 을 여 전히 론의한다. 이 것 들은 
장치의 입력，출력기구들이다. 장치는 이 류형의 일부 지적된 매체들과 련결된 입력, 출력을 유 
지하는 능력 이 있어 야 한다. 매체는 장치 묘 의 외부기 록매 체라고 부론다. 

2.7 넷째로, 장치는 요에서 특수부분 C 와 보에 정보를 전송하는 기구들을 가져야 한다. 이 기구 
들은 입력，넷째로 지적된 부분 I 를 형성한다. 그것은 R 로부터 M 에로, C 로부터 직접적으로 모 
든 전송을 하게 하는데 가장 좋은것이라는것을 알수 있다. 

2.8 다섯째로, 장치는 지적된 부분 C 와 보 에서 묘 로 전송하는 기구들을 가져야 한다. 이 기구들 
4 출력 즉 다섯번째로 지적된 부분 O 를 형성한다. 그것은 M 으로부터 (O 에 의하여 ) R 에로, C 
로부터 직접적으로 모든 전송을 하게 하는데 가장 좋은것이라는것을 알수 있다. 

아주 드문 경우를 내놓고는 오늘날 모든 콤퓨터들은 이와 같은 일반구조와 기능을 
가지 며 따라서 노이 만형콤퓨터 라고 한다. 그러므로 IAS 콤퓨테 BURK 46] 의 연산기능에 
대 하여 간단히 서 술할 펼 요가 있 다. 다음의 참고문헌 [ HAYE 88] 에 서 폰 노이 만의 용어 
와 표기들은 현재 표기 법들과 일 치하도록 변경시 켰다. 즉 이 론의를 첨부한 실례 와 그림 
설명들은 뒤에 취급된 본문들에 기초하였다. 


산수-론리 
연산장치 


I/O 


주기 억 기 
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그림 2-2. IAS 기억기형식 
一 I - 수값단어 , 명 령단어 


IAS 의 기 억기 는 40 bit 로 구성된 단어를 기 억시 킬수 있는 1000 개의 기 억장소로 구성되 
였다. 자료와 명령들은 여기에 기억된다. 그러므로 수들은 2 진수형식으로 표현되여야 하며 
매개 명 령들은 2 진코드여 야 한다. 그림 2-2 에서는 이 형식들을 그림으로 설명 하였다. 

매개 수자는 한개의 부호비트와 39 bit 


중앙처리장치 



그림 2-3. I AS 콤퓨터 의 확장된 구조 


의 값으로 표현된다. 한개의 단어는 2 
개 의 20 bit 명 령 을 포함하며 매 개 명 령 
은 수행할수 있는 연산을 지 정하는 
8 bit 의 조작코드와 기억기의 단어를 지 
적하는 12 bit 의 주소로 구성된다 (0 부 
터 999까지 의 번 호) . 

조종부는 기 억 기 로부터 명 령 을 꺼 내 
고 주어 진 시 간에 그것 을 실 행하도록 
IAS 를 조작한다. 이 실례에 대한 더 
상세 한 구조블로크도를 그림 2-3 에 보 
여 주었다. 이 그림은 조종부와 ALU 
가 등록기를 포함한다는것을 보여 주 
고 있 다. 등록기 에 대 한 구체 적내 용은 
다음과 갈다. 

• 기 억 완충등록기 (MBR) : 기 억 기 에 

기 억 하기 위한 단어 를 보관하거 나 
기 억 기 로부터 단어 를 받기 위하여 
리 용된 다. 

• 기억 주소등록기 (MAR): MBR 에 

단어를 읽 어 넣거 나 MBR 로부터 
기 억 기 에 단어 를 쓰기 위 한 기억 
기의 주소를 지적한다. 
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이때 에는 BR, IR, MAR 에 넣 어 진다. 

왜 간접적방법이라고 하는가. 이 조작들은 전자회로적으로 조종되며 자료통로를 리 
용하여 실현된다. 전자회로를 간단히 하기 위하여 읽기나 쓰기를 위한 기억기주소를 지 
적하는데 리 용되 는 등록기 가 한개 있 으며 원 천 혹은 목적 을 위하여 리용되 는 등록기 도 
한개 있다. 

일단 조작코드가 IR 에 입력되면 실행주기가 수행된다. 조종회로는 조작코드를 해신 
하며 전송되 는 자료를 발생 시 키거 나 ALU 에 의하여 수행되는 연산을 위한 적 당한 조종 
신호를 출력하는것으로 명 령을 실행한다. 

IAS 콤퓨터는 표 2-1 에 서술된것처럼 모두 21개의 명령을 가진다. 


표 2-1. IAS 명령모임 


명령형태 

조작 a 드 

기호언어 

해설 

자료전송 

00001010 

LOAD MQ 

MQ 등록기의 내용을 AC 축적기에 전송 


00001001 

LOAD MQ , M ( X ) 

기 억 주소 표 의 내 용을 MQ 에 전송 


00100001 

STOR M(X) 

축적기의 내용을 기억주소 표에 전송 


00000001 

LOAD M(X) 

M(X) 를 축적기에 전송 


00000010 

LOAD -M(X) 

- M(X) 를 축적기에 전송 


00000011 

LOAD [M(X)] 

M(X) 의 절대값을 축적기에 전송 


00000100 

LOAD - [M 法) ] 

- [M(X)] 를 축적기에 전송 

무조건 분기 

00001101 

JUMP M(X,0:19) 

M(X) 의 왼쪽 절반위치로부터 다음명령 
에로 이행 


00001110 

JUMP M(X,20：39) 

M(X) 의 오른쪽 절반위치로부터 다음명 
령에로 이행 

조건 분기 

00001111 

JUMP +M(X,0:19) 

축적 기 의 값이 정 수이라면 M(X) 의 왼쪽 
절반위치로부터 다음명령에로 이행 


00010000 

JUMP +M(X,20:39) 

축적기 의 값이 정 수이라면 M(X) 의 오른 
쪽 절반위치로부터 다음명령에로 이행 

산수연산 

00000101 

ADD M(X) 

M(X) 를 AC 에 더 하기 : AC 의 결과를 넣기 


00000111 

ADD [M(X)] 

[M 法)]를 AC 에 더하기 : AC 의 결과를 
넣기 


00000110 

SUB M(X) 

AC 로부터 M(X) 를 덜기 : AC 의 결과를 
넣기 


00001000 

SUB [M(X)] 

AC 로부터 [M 法)]를 덜기 : AC 의 결과 
를 넣기 


00001011 

MUL M(X) 

M(X) 에 MQ 를 곱하기 : AC 에 웃부분결 
과를 넣기, MQ 에 아래부분결과를 넣기 


00001100 

DIV M(X) 

AC 를 M(X) 로 나누기 : 

M(Q) 에 상을 넣기， AC 에 나머지 


00010100 

LSH 

축적 기 를 2배하기(왼쪽으로 한비 트밀 기) 


00010101 

RSH 

축적기를 2로 나누기 .(오른쪽으로 한비트 
밀기) 

주소변경 

00010010 

STOR M(X,8：19) 

M(X) 의 왼쪽 주소마당을 AC 의 오른쪽 
12bit 로 바꾸기 


00010011 

STOR M(X,28：39) 

M(X) 의 오른쪽 주소마당을 AC 의 오른 
쪽 12bit 로 바꾸기 
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이 명령들은 다음과 같이 분류할수 있다. 

• 자료전송 : 기억기와 ALU 등록기사이 혹은 두 ALU 등록기들사이 자료를 전송한다. 

• 무조건이행 : 일반적 으로 조종부는 기 억기로부터 순서대로 명 령을 실행한다. 이 순 
서는 분기명 령 에 의하여 변화될수 있다. 이것은 반복적 인 연산을 쉽게 한다. 

• 조건이 행 : 분기 는 분기 점 을 허 락하는 조건에 의 거하여 이 루어 진다. 

• 산수연산 : ALU 에 의 하여 수행 되 는 연산이 다. 

• 주소변경 : ALU 에서 계산하도록 주소를 허 락하며 이 주소는 기 억 기 에 기 억된 명 령 
들에 삽입된다. 이것은 프로그람으로 하여금 가능한 주소화의 유연성을 허락한다. 

표 2-1 에 쉽게 읽을수 있는 형식으로 기호언어명령을 주었다. 사실상 매 명령은 그 
림 2-2 가의 형식으로 구성되여야 한다. 조작코드부(첫 8 bit ) 는 실행될수 있는 21 개 명령 
중의 임의의것을 지정한다. 주소부(나머지 I 2 bit ) 는 명 령의 실행 에 포함되는 1000 개의 
기 억 주소들중의 하나를 지 정 한다. 

그림 2-4 에는 조종부에 의한 여러가지 명령실행의 실례를 보여 주었다. 매개 명령 
은 여러 단계를 요구한다고 보자. 이것들의 일부는 아주 잘 만들었다. 곱하기연산은 39 
개 의 보조연산들을 요구하며 그중 한 비 트는 부호 비 트이 므로 제 외한다. 

콤퓨터의 상품화 

1950 년대는 시 장을 독점 한 Sperry 와 IBM 두 회사에 의한 콤퓨터산업의 출현을 보 
여 주었다. 

1947 년에 에 커 트와 머 클리 는 상품용콤퓨터 를 만들기 위한 에 커 트一머 클리 콤퓨터 회 
사를 내 왔다. 이 들이 처 음으로 만든 콤퓨터 는 1950 년 예 산안계 산을 위하여 통계 조사사 
무국의 의뢰로 만들어 진 UNIVAC I (Universal Automatic Computer ) 였다. 에커트一 
머클리 회사는 Sperry-Rand 회사의 UNIVAC 부문의 한 부분으로 되였다. 

UNIVAC I 은 처 음으로 성 공한 상품화된 콤퓨터 였 다. 이 름이 의 미 하는것 처 럼 이 콤 
퓨터 는 과학적 이 며 그리 고 실 용적 인 응용을 목적 으로 한것 이 였 다. 이 체 계 를 서 술한 첫 
론문에서는 콤퓨터가 수행할수 있는 행렬대수계산，통계문제 , 인체보험회사를 위한 광고， 
군사문제들에 대하여 서술하였다. 

UNIVAC I 보다 더 큰 기억기용량과 더 높은 성능을 가진 UNIVAC II 는 1950 년대 
후반기에 개발되였으며 콤퓨터산업의 특징을 나타내는 여 러가지 경향성들을 가지고 있다. 
첫째로，기술이 발전함에 따라 회사들로 하여금 더 크고 더 능률적 인 콤퓨터를 계속 제 
작하도록 하였다. 둘째로，매 회사는 낡은 콤퓨터와 웃방향호환성을 가지는 새로운 콤퓨 
터를 만들려고 시도하였다. 이것은 낡은 콤퓨터에서 작성된 프로그람이 새로운 콤퓨터에 
서 도 실행될수 있다는것을 의 미한다. 이 전략은 사용자의 요구로부터 출발한것이 였다. 
즉 사용자들이 새로운 콤퓨터를 사려고 할 때에는 프로그람들에 투자하는 손실을 없애기 
위하여 갈은 회 사의 것 을 사려 고 한다. 

UNIVAC 는 판매 를 목적 으로 1100 계 렬 의 콤퓨터 를 개 발하기 시 작하였 다. 계 렬 이 
동시 에 존재하는 특징들을 설명 하자. 첫 형 UNIVAC 1103 과 여 러 해동안에 생산된 이 계 
렬의 형들은 기본적 으로 길고 복잡한 계산을 요구하는 과학분야에 적용되였다. 다른 회 
사들의 형들은 많은 량의 본문자료처 리를 요구하는 봉사분야의 적용에 집중하였다. 이 러 
한 적 용목적 의 분리 는 크게 나타나지 않았으나 몇년동안에 뚜렷 하게 나타났다. 

MarK 의 제 작을 도와 주었으며 그후 카드처 리 장치의 기본제 작업체 인 IBM 은 1953 
년에 첫 전자프로그람기억식콤퓨터를 개발하였다. 701 은 기본적으로 과학용으로 리용하 
였다. 1955 년에 IBM 은 봉사를 목적 으로 하는 일부 장치 적 특징을 가지는 702 제품을 개 
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발하였 다. 이 콤퓨터 들은 IBM 을 압도적 으로 우세한 콤퓨터제 작업 체 가 만든 첫 
700/7000콤퓨터의 계렬이다. 


2. 제 2 세대: 3 극소자콤퓨터 

전자관식를퓨터에서 처음으로 되는 기본변화는 전자관을 3 극소자로 바꾼것이다. 반 
도체 3 극소자는 전자관보다 훨씬 작고 눅으며 열손실이 적으나 콤퓨터제작은 전자관식과 
같은 방법으로 진행되였다. 도선，금속판，유리관과 진공을 요구하는 전자관과는 달리 3 
극소자는 규소로 만든 고체소자이다. 

3극소자는 1947 년에 벨 라브스에 의하여 발명 되 였으며 1950 년대 에 전자혁 명 이 시 작 
되게 하였다. 그러나 1950 년대 후반기까지 완전히 3 극소자로 제작된 를퓨터는 없었다. 
IBM 은 이 새로운 기술을 개발한 첫 회사로 되지 못했다. 더 명백히는 NCR 와 RCA 가 
몇개의 작은 3 극소자들로 front-runners 를 만들었다. IBM 은 인차 7000 계렬콤퓨터를 
만들었다. 

3 극소자를 리용하여 만든 콤퓨터를 제2세대콤퓨터 라고 정의한다. 기초장치기술에 기 
초하여 세대별로 콤퓨터를 분류할수 있다(표 2-2). 새로운 세대로 바껍 때마다 전 세대보 
다 더 높은 속도，더 큰 기 억용량，더 작은 물리적크기를 가진 를퓨터 가 출현하였다. 


표 2-2. 콤퓨터세대 


세대 

대략적인 기간 

기술 

일반적인 속도 
(초당 연산수) 

1 

1946〜1959 

전자관 

40,000 

2 

1958〜1964 

3 극소자 

200,000 

3 

1965〜1971 

중소규모집적회로 

1,000,000 

4 

1972 〜1977 

대 규모집 적 회로 

10,000,000 

5 

1978〜 

초대규모집적회로 

100,000,000 


또한 다른 변화들도 있 다. 제 2 세 대 콤퓨터 들에는 더 복잡한 산수연산부，조종부 그 
리 고 고수준프로그람언 어 와 를퓨터체 계프로그람들이 장비되 였 다. 

제 2 세 대 콤퓨터 에서 는 또한 DEC 회 사가 적 지 않은 역 할을 놀았다. DEC 는 1957 년 
에 나왔으며 그때 PDP -1 이 라는 첫 콤퓨터를 출품하였다. 이 콤퓨터는 제 3 세대로의 돌 
파구를 여는 소형콤퓨터의 시작이였다. 

IBM 7094 

1952 년에 제 작된 700 계 렬 로부터 1964 년에 제 작된 7000 계 렬의 마지 막번호까지 IBM 
제품계렬들은 콤퓨터제품의 표준적발전을 급속히 촉진하였다 . 제품계렬의 련속적인 번호 
들은 성능증가，용량증가, 저가격화를 보여 준다. 

표 2-3 은 이 경 향성 을 설명해 준다. 주기억기의 크기는 1 K 父 36 bit 단어의 배수로 
서 2 k 로부터 32 k 단어까지 증가하였 으며 기 억기의 한 단어접근시 간 즉 기 억기주기시간은 
30 ms 로부터 1.4 ms 로 단축되 였 다. 조작코드의 수는 최 대 24 개 로부터 185 개 까지 늘어 
났다. 

표 2-3 의 마지막렬은 CPU 의 상대실행속도를 보여 준다. 속도의 증가는 전자회로의 
갱신과 더 복잡한 회로를 구성함으로써 달성되였다. 실례로 IBM 7094 는 다음명령을 완 
충하기 위한 명 령보관등록기를 가진다. 조종부는 명 령을 꺼 낼 때 에 기 억기로부터 두개의 
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둘이다. 이와 갈은 장치들로 구성된 콤퓨터체계는 CPU 가 세부적인 I/O 명령들을 실행 
하지 않는다. 세부적인 I 八) 명령들은 주기억기에 기억되여 있으며 자료통로에 있는 전문 
적 인 처 리 장치 에 의하여 실행된다. CPU 는 자료통로에 조종신호를 보내 고 기 억 기 에 있 
는 명 령순서배 렬을 통로가 실행하도록 지시 함으로써 I/O 전송에 착수한다. 자료통로는 
연산을 진행하는 CPU 와 CPU 의 신호들과 독립 적 으로 이 과제 를 수행한다. 이 구성 은 
처 리 부하가 많은 CPU 를 해 방시 켜 준다. 

다른 새 로운 특징은 자료통로， CPU , 기 억기를 위한 중심마디점 인 다중분배기 이다. 
다중분배기는 CPU 와 자료통로들이 독립적으로 동작하도록 하면서 기억기에 대한 접근 
을 진행 하도록 순서화한다. 

3. 제 3 세대: 집적회로콤퓨터 


개별적인 3극소자로 이루어 진 구성부분을 분리형구성부분이라고 한다. 1950년대와 
1960 년대 초까지 전자장치 들은 3극소자，저 항과 축전기 등으로 구성 되 였 다. 분리 형 구성 
부분들은 따로따로 하나하나 제작되여 자기들의 용기 에 포장되며 회 로기관에 배선 혹은 
납탬되여 콤퓨터나 오썰로그라프 등 전자제품들에 설치된다. 3 극소자로 이루어 졌다고 
하는 전자장치 모두는 소자의 다리 가 회 로기 판의 작은 구멍 에 납탬 되 여 있 다. 3극소자로 
부터 회로기판까지의 제작공정은 비용이 많이 들며 복잡하다. 

이 사실들은 콤퓨터산업 에서 문제 로 되 였 다. 제 2세 대 콤퓨터들은 대 략 10000개의 3 
극소자를 가지고 있었다. 이 구성은 몇십만개로 늘어 났으며 더 새롭고 더 능률적 인 전 
자장치를 제작하기 어렵게 하였다. 

1958 년에 전자혁명에 의하여 집적회로가 발명되여 미소전자시대가 시작되였다. 콤 
퓨터의 제 3 세대는 집적회로로 되였다. 이 절에서 집적회로기술을 간단히 소개한다. 그 
다음 3 세대의 시작으로 되는 가장 표준적인 두개의 를퓨터 IBM System /360 과 DEC 
PDP -8 을 고찰한다. 


미소전자 

미소전자는 글자그대로《작은 전자》라는 의미이다. 수자회로와 를퓨터산업의 시작 
으로부터 수자회 로의 크기 를 감소시키는것 이 추세 로 되 였 다. 이 추세의 함축된 의미와 
우점을 설명하기전에 수자회로의 본질에 대하여 고찰하여야 한다. 상세한 설명은 부록 
I 에서 찾으면 된다. 

우리가 알고 있는 수자형콤퓨터의 기본요소들은 기억，전송，처리，조종기능을 수행 
하여 야 한다. 구성부분은 다만 두가지 기본형 태로서 문소자들과 기억세포만을 요구한다 
(그림 2-6). 문소자는 IF A AND B ARE TRUE THEN C IS TRUE (AND 문) 와 같은 간단한 
불 혹은 론리기 능을 실 행하는 소자이 다. 이 와 갈은 소자들은 수문들이 하는것 과 갈은 방 
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그림 2-6. 기초콤퓨터요소 
T - 문, " L - 기억기세포 






법 으로 자료흐름을 조종하기때문에 문소자라고 한다. 기 억세포는 자료의 한개 비트를 기 
억시킬수 있는 요소이다. 즉 이 요소는 임의의 순간에 두개의 안정상태중의 한 상태로 
될 수 있 다. 이 기 본요소들을 많이 결 합하여 콤퓨터 를 구성한다. 우리 는 다음과 갈은 4 
개의 기본기능들에 이것을 련관시킬수 있다. 

• 자료기 억 : 기 억세 포들에 의하여 이 루어 진다. 

• 자료처 리 : 문소자들에 의하여 이 루어 진 다. 

• 자료전송 : 구성부분들사이의 경로는 기억기로부터 기억기에로 그리고 기억기로부 
터 문소자를 통하여 기억기에로 자료를 전송하는데 리용된다. 

• 조종: 구성부분들사이의 경로는 조종신호를 전송할수 있다. 실례로 문소자는 하나 
혹은 두개의 자료입구들과 문을 능동상태로 만드는 조종신호입구를 가질수 있다. 
조종신호가 ON 으로 될 때 문소자는 자료를 입 력하고 출력한다. 마찬가지로 기 억 
세 포는 WRITE 조종신호가 ON 일 때 그 입 구선의 비 트를 기 억 하며 READ 조종신 
호가 ON 일 때 그의 출구선으로 비 트를 출구한다. 

결국 콤퓨터는 문과 기억세포들의 호상결합으로 구성된다. 또한 문과 기억요소들은 
간단한 수자회로요소들로 구성된다. 

집적회로는 3 극소자，저항，도체들과 같은 구성요소들이 규소와 같은 반도체로 만 
들어 진다는 원리를 리용하였다. 그것은 같은 회로에서 분리된 규소소편으로부터 만들어 
진 분리 형 구성 부분들을 조립하는것 이 아니 라 매 우 작은 규소소편에 전체 회 로를 제 작하 
는 고체 상태 기 술의 확장이다. 많은 3 극소자들이 한개 의 얇은 규소박편우에 동시 에 제 작 
된다. 여기서 중요한것은 이 3 극소자들이 도금처리에 의하여 련결되여 회로를 형성할수 
있 다는것 이 다. 

그림 2-7 에 집적회로의 기본개념을 
주었다. 얇은 규소박편은 매개가 수평방 
미 리메터 인 작은 령역 들의 행 렬로 분할 
된다. 이 매 작은 령역에 동일한 회로블 
이 제작되여 박편이 소편들로 된다. 매 
개 소자들은 많은 문과 기 억세포들 그리 
고 여러개의 입출구련결점들로 이루어 
진다. 그다음 이 소편은 보호를 위하여 
함침 되 며 다른 장치 들과 련 결 하기 위한 
단자들이 제공된다. 이 집적회로들이 더 
크고 복잡한 회 로를 구성하도록 인쇄 기 
판에 서로 련결된다. 

초기에는 적은 수의 문희로 혹은 기 
억세포들이 한개 소편에 견고하게 제작 
되였다. 초기에 이 집적회로들은 소규모 
집적회로 ( SSI ) 라고 불렀다. 날이 감에 
따라 더 많은 구성부분들을 갈은 소편에 
묶을수 있게 되였다. 이 집적도의 장성 
을 그림 2-8 에 주었다. 즉 그림 에서 보 
여 준것 이 가장 주목할만한 기 술적발전 
추세 의 하나이 다. 이 그림 은 유명한 무 
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어의 법 칙을 반영하며 이 법칙은 1965 년에 인텔의 공동개 발자인 고든 무어 (Gordon 
Moore ) 에 의 하여 제 안되였다 [ MOOR 65]. 무어는 한 소편에 들어 갈수 있는 3 극소자의 
수가 매해 2 배 늘어 나며 이러한 경향은 가까운 앞날에도 계속될것이라는것을 정확히 
예측하였다. 더 놀라운것은 이 속도가 세월이 호를수록 계속 유지되였다는것이다. 1970 
년대 18개 월동안 이 속도가 떠졌으나 그후 이 속도는 유지되 였다. 

무어법 칙의 결과는 다음과 갈다. 

108 


10 7 


10 4 


103 

1970 1975 1980 1985 1990 1995 2000 2005 

그림 2-8. CPU 3 극소자수의 증가특성 

• 소편의 가격 은 집 적 도가 급속히 장성하는 동안에 실제 적 으로 변하지 않고 유지되 
였다. 이것은 콤퓨터론리회로와 기억회로의 가격이 급격히 떨어 졌다는것을 의미 
한다. 

• 론리회 로와 기 억 요소들이 보다 조밀한 소편에 함께 배 치 되 여 있으므로 배 선의 길 
이가 짧아 지고 연산속도가 증가한다. 

• 콤퓨터는 더 작아 지며 여 러 가지 환경들에 설치되 여 더 쓰기 편리해 진다. 

• 전력과 랭각요구가 감소된다. 

• 집적회로에서 호상련결은 납땜에 의한 련결보다 더 믿음성이 있다. 매개 소편들이 
더 많은 회 로를 가지게 하면 소편들사이 련결은 보다 적 어 질것 이다. 

IBM System /360 

1964년에 IBM 은 7000계렬콤퓨터를 출품하여 콤퓨터시장에서 확고한 지위를 차지하 
였다. 그때 IBM 은 콤퓨터의 새로운 계렬인 system /360 을 개발하였다. 그자체의 개발은 
놀랍지 않았지 만 그때 의 IBM 구입 자들에 게 는 새 롭게 일종의 불쾌 감을 주었 다. 즉 360 계 
렬은 지난 날의 IBM 기종들과 호환성이 없었다. 따라서 그때 사용자들을 360 에로 전환 
시키기 어려웠다. 이것은 IBM 에 의한 대담한 결심이였다. 그러나 IBM 이 생각하는것은 
7000 계렬의 일부 제한성을 없애고 새로운 집적회로기술발전에 상응한 체계를 생산하여 
야 한다는것이다. 전략은 재정적으로나 기술적으로 수지가 맞았다. 360은 10년간 성과를 
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이 룩하였 고 70 % 가 넘 는 시 장을 차지하여 콤퓨터사용자들을 우세하게 독점 함으로써 
IBM 은 아주 견고해 졌 다. 그리 고 일부 변경 되 고 확장된 360방식 은 오늘까지 IBM 의 대 
형 기방식 으로 유지 되 였 다. 이 방식 을 리 용한 실 례 들을 이 본문을 통하여 고찰할수 있 다. 

Systenn /360 은 공업적으로 콤퓨터의 첫 계획화된 계렬이였다. IBM 계렬에서 성능과 
가격 은 넓 은 범 위 를 가진 다. 표 2-4 에 1965 년의 여 러 가지 형 에 대 한 기 본특성 을 지 적 하 
였다(계렬의 매개 형은 형번호에 의하여 구별된다.). 형들은 실행시간에서 차이나지만 
계 렬의 낮은급형 에서 작성된 프로그람은 계 렬의 높은급형 에서 실행할수 있다. 

표 2-4. System /360 계 렬의 기 본특성 


특성 30 형 40 형 50 형 65 형 75 형 


최 대 기 억 용량, byte 

64 K 

256 K 

256 K 

512 K 

512 K 

기 억 기 자료속도, M byte/s 

0.5 

0.8 

2.0 

8.0 

16.0 

처리장치 주기시간, us 

1.0 

0.625 

0.5 

0.25 

0.2 

상대속도 

1 

3.5 

10 

21 

50 

자료통로의 최대수 

3 

3 

4 

6 

6 

한 통로의 최대 자료속도， 

kbyte/s 

250 

400 

800 

1250 

1250 


호환성 콤퓨터 들의 계 렬 화개 념 은 새 롭고 성 공적이 였 다. 적 당한 요구와 적 은 예 산을 
요구하는 구입자들은 상대적으로 눅은 30 형으로부터 시작하였다. 후에 구입자들의 요구 
가 늘어 나면 이미 개발된 프로그람에 대한 투자를 잃어 버러지 않고도 더 빠른 콤퓨터 
와 더 많은 기 억기로 갱신할수 있다. 계렬화의 특징은 다음과 갈다. 

• 류사한 혹은 동일한 명령모임 : 많은 경우 꼭 같은 기계어명령모임이 계렬의 모든 
형들에서 보장된다. 따라서 어느 한 콤퓨터에서 실행되는 프로그람은 다른 임의의 
콤퓨터에서도 실행될수 있다. 일부 경우 계렬의 제일 낮은 급의 콤퓨터는 제일 높 
은 급의 부분적인 명령모임을 가진다. 이것은 프로그람들이 높은 급에서는 실행될 
수 있으나 높은 급에서 개 발된 프로그람들이 낮은 급에서는 실행될수 없다는것을 
의 미 한다. 

• 류사한 혹은 동일한 조작체계 : 갈은 기본조작체계는 모든 계렬의 형들에서 리용될 
수 있다. 일부 경우 추가적인 특성들은 더 높은급 콤퓨터들에 추가된다. 

• 속도중가 : 명령실행속도는 낮은 급으로부터 높은 급으로 올라 가면서 증가한다. 

• I/O 포구수의 중가 : 낮은 급으로부터 높은 급으로 가면서 증가한다. 

• 기억용량의 중가 : 같은 계렬의 낮은 급으로부터 높은 급으로 올라 가면서 증가한다. 

• 가격중가 : 갈은 계렬의 낮은 급으로부터 높은 급으로 올라 가면서 증가한다. 

이와 같은 계렬화개념은 어떻게 실현되는가? 차이점들은 3 가지 요인 즉 속도，크 
기，동시성정도에 기초한다. 실례로 주어 진 명령의 실행에서 더 높은 속도는 병렬로 출 
구하는 보조연산들을 가지는 ALU 의 더 복잡한 회로들을 리용함으로써 달성된다. 속도 
증가의 또 하나의 다른 방법 은 주기억 기 와 CPU 사이 의 자료통로의 폭을 넓 히 는것 이 다. 
30 형에서는 한번에 주기억기로부터 lbyte 의 꺼내기를 할수 있으며 반면에 70 형에서는 
한번에 8byte 를 꺼낼수 있다. 

system/360 은 IBM 의 앞으로의 방향을 지 적 하지 않았지 만 전반적 산업 에 서 크게 영 
향을 주었다. 이러한 대부분의 특성들이 다른 대형콤퓨터들에서 표준화되였다. 
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DEC PDP-8 

IBM 이 처 음으로 system/360 을 운영 하던 그때 또 하나의 DEC 의 PCP-8 이 라는 콤 
퓨터가 개발되였다. 보통 를퓨터가 공기조화기가 달린 방을 요구할 때 PDP-8 은 실험실 
걸상우에 올려 놓거 나 다른 기 구에 설 치 할수 있을 정 도로 작았다. PDP-8 은 대 형 콤퓨터 
가 할수 있는 모든 일 을 할수 없 었 다. 그러 나 16,000 딸라로서 콤퓨터 를 구입하려 는 실 
험실전문가들에게는 충분히 눅은 가격이 였다. 대 비적으로 대형콤퓨터 인 system/360 계 렬 
은 PDP-8 개 발의 몇달전에 수십 만딸라의 가격 으로 소개 되 였 다. 


표 2-5. 

PDP -8 의 

발전 [ VOEL 88] 




령 

첫 상품화 
번호 

처리^치 44K 
12bit 단어기억기 
의 기격 (천딸라) 

기억기의 
자료속도 
(단어 八 is ) 

체적 

(립방피트) 

혁신과 개선 

PDP -8 

4/65 

16.2 

1.26 

8.0 

자동배선포 H 

PDP -8/5 

9/66 

8.79 

0.08 

3.2 

명령계렬화실현 

PDP -8/1 

4/68 

11.6 

1.34 

8.0 

중규모집적회로 

PDP -8 /L 

11/68 

7.0 

1.26 

2.0 

소규모캐 비 네 트 

PDP -8 /E 

3/71 

4.99 

1.52 

2.2 

전용모선 

PDP -8 /M 

6/72 

3.69 

1.52 

1.8 

8 /E 의 절반정도의 
캐 비 네 트 

PDP -8 /A 

1/75 

2.6 

1.34 

1.2 

반도체 기 억 기 
류점수처리장치 


PDP-8 의 눅은 가격과 작은 크기는 PDP-8 을 사들여 재 판매를 실현하려 는 또 다른 
제 작자들을 만들었 다. 이 제 작자들을 기 본기 구제 작자들 (OEMs) 이 라고 알려 져 있 으며 
◦EM 시 장은 콤퓨터 시 장의 기 본부분을 이 루고 유지 하였 다. 

PDP-8 은 즉시 인기를 끌었으며 DEC 회사가 부흥하게 하였다. 이 를퓨터와 이것을 
계승한 PDP-8 계 렬의 다음형 (표 2-5 를 참고)들은 IBM 콤퓨터들에서 이전에 보존하였던 
생 산지 위 를 차지 하였 으며 5 만딸라로 12 년동안 팔렸 다. DEC 의 공식 적 인 력 사가 시 작되 
여 PDP-8 은 수십 억딸라산업을 위한 방향으로 유도하면서 소형를퓨터들의 개 념을 세 웠 
다. 또한 DEC 는 첫 소형콤퓨터회사로서 설립되였으며 그 시기에 PDP-8 이 절정에 이르 
러 DEC 는 IBM 다음가는 를퓨터 제 작자로 되 였 다. 

IBM 이 700/7000 과 system/360 체 계 들에 서 리 용한 중심 절 환방식 에 비 하여 PDP-8 후 
에 제작된 형들은 실제적으로 소형콤퓨터와 극소형콤퓨터들에 공동으로 쓰이는 모선구조 
를 리 용하였다. 이것 을 그림 2-9 에서 설명하였 다. 전용모선이라고 하는 PDP-8 모선은 



그림 2-9. PDP -8 모선구조 
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조종，주소, 자료신호들을 전송하기 위한 96 개의 개 별적 인 신호선들로 구성 되 였다. 모 
든 체 계구성부분들은 신호경 로들의 공동모임 을 공유하기때문에 그것들의 리용은 CPU 에 
의하여 조종되 여 야 한다. 이 방식 은 아주 유연하며 여 러 가지 구성 들을 만들기 위 하여 모 
선에 장치 들을 결 합하는것 을 허 락한다. 그림 2-10 에 PDP -8 /E 구성 을 보여 주었 다. 

4. 다음세대의 콤퓨티 

3 세대를 지나 를퓨터의 세대를 정의하는 경우 일반적으로 의견이 일치되지 않고 있 
다. 표 2-2 에서는 집적회 로기술의 발전에 기초하여 4 세대와 5 세대를 분류하였다. 한개 
의 집적회로소편에 1,000 개이상의 구성요소가 배치되여 있는 대규모집적회로 ( LSI ) 와 소 
편당 구성요소수가 10,000 개 이상인 초대규모집적회로 ( VLSI ) 가 있으며 현재 VLSI 소편 
은 100,000개 의 구성 요소들을 가지 고 있 다. 

기술의 빠른 속도, 새 제품들의 빠른 출현 그리고 장치와 같이 프로그람과 통신의 
중요성 으로 하여 세 대의 구별은 명백치 않다. 새 로운 발전들의 상품적응용은 이미 1970 
년대에 기본변화를 가져 왔으며 아직까지 이 변화들이 계속되고 있다고 말할수 있다. 이 
절에서는 가장 중요한 두가지 문제에 대하여 고찰한다. 

반도체기억기 

콤퓨터 를 위 한 반도체집적회 로기술의 첫 응용은 집적회 로소편들에서 의 처 리 장치(조종단 
위와 산수 및 론리단위)의 실현이였다. 또한 이와 갈은 기술은 기억기구성에도 리용되였다. 

1950 년대 와 1960 년대 에 거의 모든 콤퓨터 기억기는 자심기 억기였으며 자심 기 억기의 
직 경은 대 략 1/16 인치 였다. 자심들은 콤퓨터안의 작은 쇠 그물형태의 도선들에 매 달려 
있었다. 자심의 자화된 한 방향은 1 로 표현하며 자화된 다른 방향은 0 으로 표현한다. 
자심기억기는 속도가 비교적 빠르다. 즉 기억기에 기억된 lbit 읽기는 초당 백만회로서 
짧은시 간이 걸린다. 그러 나 이것은 비용이 많이 들고 체적 이 크며 읽을 때 에 자료를 잃 
어 버린다. 즉 자심에 대한 읽기를 하면 거기에 기 억된 자료는 지워 진다. 그러므로 반 
드시 자료를 읽자마자 즉시 로 자료를 재 기억 시 키 는 회 로가 있 어 야 한다. 

그후 1970 년에 패 어차일드는 처음으로 용량이 큰 반도체기 억기를 만들었다. 이 소 
자는 한개 의 자심 기 억 기 알갱 이 만한 크기 를 가지 며 256 bit 의 기 억 용량을 가지 였 다. 자심 
기억기에 비하여 속도가 더 빠르고 자료를 잃어 버러지 않았다. 비트읽기속도는 초당 
700 억 회 였 다. 그러 나 자심 기 억 기 보다 비 트당 가격 이 더 높았다. 

1974 년에 근본적 인 변화가 일 어 났다. 즉 반도체 기 억 기의 비 트당 가격 이 자심기 억 
기의 비트당 가격보다 떨어 졌다. 물리적인 기억기밀도의 증가에 따르는 기억기가격은 
련속적으로 그리고 빠르게 떨어 졌다. 이것은 더 작고 더 빠르며 더 큰 기억기용량을 가 
진 콤퓨터방향으로 몇년동안에 그 값도 서서 히 비싸 졌다. 기 억기기술에서 의 발전은 다 
음에 론의하게 되 는 처 리 장치 기 술의 발전과 함께 10 년 남짓한 기 간에 콤퓨터 의 본질 을 
변화시켰다. 비록 체적이 크고 값 비싼 콤퓨터들이 관상용으로 남아 있지만 콤퓨터는 사 
무용콤퓨터 와 개 인용콤퓨터 와 갈은 사용자용으로 변화되 였다. 

1970 년부터 반도체기 억기는 10개의 세대를 거 쳐 즉 한 소편에 lkbit ，4 kbit , 16 kbit , 
64 kbit , 256 Kbit , 1 Mbit , 4 Mbit , 16 Mbit , 64 Mbit , 256 Mbit 를 기 억시 킬수 있는 단계 볼 
로 발전하였다. 매개 세대는 전 세대에 비하여 4 배의 기억밀도를 가지며 접근속도가 빨 
라 지고 비트당 가격 이 떨어 졌다. 
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극소형처리장치 

기억기소편들에서 요소들의 밀도가 계속 올라 감에 따라 처리장치소편들에서 요소들 
의 밀도도 계속 올라 간다. 시간이 갈수록 더 많은 요소들이 한 소편에 집적화되며 따라 
서 한개의 콤퓨터 처 리 장치를 구성 하는데 더 적은 소편들이 요구된다. 

인텔이 4004 를 개발하였을 때 인 19기 년에 돌파구가 열리 였다. 4004 는 한개 소편에 CPU 
의 구성부분모두를 포함시키는 첫 소편이였으며 이때 극소형처리장치가 나오게 되였다. 

4004 는 두개 의 4 bit 수를 더 하기할수 있 으며 더 하기반복방법 으로 곱하기연산을 할수 
있 다. 4004 는 발전성 이 없는 초기 제 품이 였지 만 극소형처 리 장치 능력 의 련속적 인 진화의 
전망을 열어 놓았다. 

이 진화는 처 리 장치 가 한번 에 처 리하는 비 트의 수에 의하여 아주 쉽 게 표현 할수 있 
다. 이것을 명 백히 밝히는 척도는 없지 만 대체로 처 리 장치 가 한번에 입 력하거 나 출력할 
수 있는 자료의 비트수인 자료모선폭이 가장 좋은 척도라고 생각된다. 다른 하나는 축적 
기 혹은 일반등록기들에서의 비트수이다. 흔히 이 비트수들이 일치하지만 항상 그렇지 
는 않다. 실례로 극소형처리장치들의 일부는 등록기들에서 16 bit 수로 연산하게 개발되였 
지 만 한번에 8 bit 씩 읽 기 쓰기할수 있 다. 

극소형처리장치의 진화에서 다음의 기본단계는 1972년에 개발된 Intel 의 8008이다. 이 
것 은 처 음으로 되 는 8 bit 극소형 처 리 장치 였 으며 4004 를 2 개 복합시 켰 다. 이 단계 들은 1 OT 4 
년에 Intel 이 8080을 개발하는데 아무런 영향도 미치지 못하였다. 8080은 처음으로 되는 일 
반용극소형 처 리 장치 였 다. 4004 와 8008 은 특수한 응용을 위 하여 설 계 되 였 다. 8080 은 일 반용 
극소형콤퓨터를 위 한 CPU 로 설계되 였다. 8008과 같이 8080은 8 bit 극소형 처 리 장치 이 다. 그 
러나 8080 은 더 빠르고 더 풍부한 명령모임을 가지며 더 큰 주소화능력을 가전다. 거의 같 
은 시기에 16 bit 극소형처리장치들이 개발되기 시작하였다. 그러나 위력한 일반용극소형처 
리장치들이 개발될 때 인 1970 년대 말까지는 쓰이지 않았다. 그것들중 하나가 8086 이였다. 
다음단계는 벨라브와 훌레트 팩카드가 32 b 社 한소편극소형 처 리 장치를 개 발할 때 인 1981 년 
이 였다. 인텔은 1985 년에 32 bit 극소형 처 리 장치 80386 을 개 발하였 다(표 2_6) . 

표 2-6. 인텔극소형 처 리소자의 발전 


1)1970 년대 극소형 처 리 장치 들 



4004 

8008 

8080 

8086 

8088 

생산날자 

11/5/71 

4/1/72 

4/1/74 

6/8/78 

6/1/79 

박자속도 

108 KHZ 

108 KHZ 

2 MHz 

5 MHz , 8 MHz , 10 MHz 

5 MHz , 8 MHz 

모선폭 

4 bit 

8 bit 

8 bit 

16 bit 

8 bit 

반도체수 (미크론) 

2,300(10) 

3,500 

6,000(6) 

29,000(3) 

29,000(3) 

주소가능한 기억기 

640 byte 

16 kbyte 

64 kbyte 

1 Mbyte 

1 Mbyte 

가상기억기 

— 

— 





l )1980 년대 극소형 처 리 장치들 



80286 

인텔 386TM DX 
처리장치 

인텔 386TMSX 
처리장치 

인텔 486TM DX 
CPU 처리장치 

생산날자 

2/1/82 

10/17/85 

6/16/88 

4/10/89 

박자속도 

6 MHz -12.5 MHz 

16 MHz -33 MHz 

16 MHz -33 MHz 

25 MHz -50 MHz 

모선폭 

16 bit 

32 bit 

16 bit 

32 bit 

반도체수⑴ 1크론) 

134,000(1.5) 

275,000(1) 

275,000(1) 

1.200000(0.8-1) 

주소가능한 기억기 

16 M byte 

4 Gbyte 

4 Gbyte 

4 Gbyte 

가상기억기 

1 Gbyte 

64 Tbyte 

64 Tbyte 

64 Tbyte 
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제 2 절. 성능설계 

해마다 콤퓨터체계의 가격은 급격히 떨어 지는 한편 콤퓨터체계의 성능과 능력은 급 
격히 올라 간다. 지 방의 를퓨터상점들에서도 10 년전의 IBM 대형콤퓨터의 위력과 맞먹는 
1000 딸라이하의 개인용콤퓨터들을 살수 있다. 극소형처리장치，기억기와 다른 소자들을 
포함하는 개 인용콤퓨터안에는 1 억개정도의 3극소자가 있다. 그만한 돈으로 임의의 물건 
을 1 억 개 살수는 없 다. 휴지 종이 라고 해 도 10만딸라이 상 들것 이 다. 

이처럼 위력한 콤퓨터를 아주 령가로 살수 있게 되였다. 그리고 계속적인 기술발전 
으로 하여 몹시 놀랄만큼 복잡하고 위 력한 응용프로그람을 개발할수 있게 되 였다. 실례 
로 오늘 극소형처리장치에 기초한 위력한 체계들을 요구하는 탁상형콤퓨터응용프로그람 
들은 다음과 갈다. 

• 화상처리프로그람 

• 음성인식프로그람 

• 비데오회의프로그람 

• 다매체저작프로그람 

• 파일들의 음성 및 영상해설프로그람 

현재 워크스테 이션체계들은 모형화체계들과 갈은 더 높은 급의 공학과 과학응용프로 
그람들을 지 원하며 화상과 비 데 오응용프로그람들로 작업그룹원리 들을 적 용하기 위 한 능 
력을 지원한다. 더우기 봉사는 업무와 자료기지처 리를 조종하고 지난기간의 큰 대형콤퓨 
터 집 중처 리 체 계 를 대 신하는 방대 한 의 뢰 기-봉사기망들을 지 원하기 위한 효률적 인 봉사들 
에 점 차적으로 의거하고 있다. 

콤퓨터 구성 과 구성 방식 의 관점 으로부터 이 모든것 들을 고찰하면 하나는 현대 콤퓨터 들이 
50 년전의 IAS 콤퓨터 와 본질적 으로 같다는것 이며 다른 하나는 가까운 앞날에 현대적 인 를퓨 
터들의 성능을 최대로 달성할수 있는 기술이 점차적으로 준비되고 있다는것이다. 

이 책에서 콤퓨터의 세부요소와 구성부분들을 고찰할 때 두가지 대상에 주목하게 된 
다. 첫째 로는 이 책 이 고찰하는 모든 범 위 에서 기 본적 인 기능들을 설명하는것 이 고 둘째 
로는 이 책 이 최 대성능을 달성 하기 위하여 요구되는 기 술들을 주는것 이 다. 이 절의 나머 
지부분들에서 성능설계에 필요한 일부 구동요소들을 명백히 서술하였다. 
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1. 극소형처리장치의 속도 

놀랄만한 위력을 가진 Pentium 이나 PowerPC 를 소개한것은 처 리장치소편제작자들 
에 의하여 처 리 장치 의 속도가 높아 졌기때 문이 다. 이 처 리 장치 들의 속도는 이 미 전에 말 
한바와 같이 무어의 법칙에 따라 발전한다. 이 법칙이 성립하는 기간 처리장치소편제작 
자들은 매 3 년마다 3 극소자의 집적도를 4 배로 증가시킨 새로운 소편을 만들것이다. 기 
억기소편에서도 여전히 3 년주기 로 콤퓨터주기억기의 기 본기술인 동적 자유접근기 억기 
( DRAM ) 의 용량이 4배로 높아 진다. 극소형처 리 장치들에서 새로운 회로가 추가되고 요 
소들사이의 거리를 축소한데로부터 오는 속도증가로 인텔도 1978년에 x 86 계렬을 내놓은 
때 로부터 3 년주기 로 성 능을 4-5 배 로 증가시 켰 다. 

그러 나 극소형 처 리 장치 의 본래 속도는 콤퓨터 명 령 형 식 에 따라 진행 하는 작업 의 정 상 
적 인 흐름을 보장하지 않고서는 자기의 잠재적속도에 다 도달할수 없다. 이 순조로운 흐 
름을 얻기 위한 그 어떠한 방법들도 처리소자의 능력에는 도달하지 못한다. 따라서 소편 
제 작자들이 집적 도가 더욱 높은 소편을 어 떻게 제 작할것 인가하는 연구사업 을 진행하는 
한편 처 리 소자설 계 가들은 이 불균형 을 해 결 하기 위하여 더 세 련된 기 술들을 개 발하여 야 
한다. 현대처 리 소자들을 구축하는 기 술들가운데 는 다음과 갈은것 이 있 다. 

• 분기예 측 : 처 리 장치 들은 먼저 실행 한 프로그람의 앞부분에 대 한 고찰을 진행 하여 
명령들의 분기점을 예측하고 다음처리를 순조롭게 한다. 만일 처리장치가 거의 모 
두를 추측하였다면 정확한 명령미리꺼내기를 진행하고 처리장치가 정상적으로 연 
산하도록 그것을 완충할것이다. 이 방법의 더 복잡한 실례는 다음의 분기가 명백 
하지 않은것을 예측하는것 즉 분기선두가 여 러개 인것 이 다. 따라서 분기예측은 더 
복잡해 진다. 

• 자료흐름분석 : 처리장치는 최적인 명령순서를 만들기 위하여 어떤 명령들이 다른 결 
과 혹은 자료에 의존되는가를 분석한다. 실제로 기본프로그람의 순서와 관계 없이 명 
령들은 준비되면 실행될수 있게 순서화된다. 이것은 불필요한 지연을 막는다. 

• 투기적실행 : 분기예측과 자료흐름분석을 리용하면서 일부 처리장치들은 프로그람 
실행에 선행하여 일부 명령들을 먼저 투기적으로 실행하며 그 결과들을 림시적인 
위치에 보관한다. 이것은 처리장치로 하여금 필요한 명령들을 실행함으로써 가능 
한껏 실행기구들이 쉬임없이 동작하도록 한다. 

이 기 술들과 다른 복잡한 기 술들은 처 리 장치 의 능력 을 완전히 발휘하도록 하는데 반 
드시 필요하다. 

2. 성능의 균형화 

처 리장치능력 이 매우 빠른 속도로 높아 지고 있지만 콤퓨터의 구성부분들은 그렇지 
못하다. 따라서 성능의 균형화 즉 여러 구성부분들의 능력들가운데서 불균형을 보상하기 
위 하여 구성과 구성 방식을 조정 할것을 요구한다. 

처리장치와 주기억기사이의 대면부에서 보다 더 심한 불균형들에 의하여 제기되는 
문제 들이 있 다. 그림 2-11 에 그려 진 력 사를 고찰하자. 처 리 장치의 속도와 주기억 기의 
용량이 빠른 속도로 증가하는 한편 자료가 주기억기와 처리장치사이에 전송될수 있는 속 
도는 대 단히 느리 다. 처 리 장치와 주기억기사이의 대 면부는 기 억기소편들과 처 리 장치소편 
사이에 프로그람명령들과 자료들의 정상적인 흐름을 보장하도록 되여야 하므로 전반적인 


37 




1990 1995 


그림 2-11. DRAM 과 처 리 장치 특성 들의 발전 


콤퓨터에서 가장 결정적인것은 전송통로이다. 만일 기억기와 전송통로가 처리장치의 요 
구를 따르지 못하면 처리장치는 기다림상태의 무효공간을 가지게 되며 귀중한 처리시간 
을 잃어 버리게 된다. 

이 추세들의 영향을 그림 2-12 에서 생동하게 보여 주었다. 요구되는 주기억기의 총 
용량이 올라 가고 또한 DRAM 집적도도 빠른 속도로 올라 간다. 결과로서 평균적인 체 
계당 DRAM 수는 줄어 든다. 그림 에 서 굵은 검 은선은 이 관계 를 보여 주며 고정 된 크기 
의 기 억기에 대 하여 요구되는 DRAM 의 수는 감소한다. 그러 나 이것은 전송속도에 영향 
을 미친다. 그림에서 그늘진 부분은 체계의 특징들중 주기억기의 크기가 천천히 증가하 
면 DRAM 의 수가 감소한다는것 을 보여 준다. 

체계설계가들이 이 문제를 해결할수 있는 여러가지 방법들이 있는데 그것들 모두가 
현재 콤퓨터설계들에 반영되였다. 실례로 다음과 갈은것들을 들수 있다. 

• 넓은 모선폭을 가진 DRAM 들을 제 작하여 넓은 모선자료통로를 리용함으로써 한 
번에 전송하는 비트수를 증가시킨다. 

• DRAM 소편에 캐 쉬 와 다른 완충용토막을 넣 음으로써 더 능률적 인 전송을 위한 
DRAM 대 면부를 변화시 킨다. 

• 처 리 장치 와 주기억 기 사이에 점 차 복잡하고 능률적 인 캐 쉬 구조들을 삽입하여 기 억 
기접근회수를 감소시킨다. 이것은 처리장치소편안에 있는 무소편캐쉬와 같이 처리 
장치 소편에 하나이 상의 캐쉬를 삽입시 키는것 도 포함한다. 

• 고속모선，완충기 를 위한 모선들의 계 층화 및 구조적 인 자료흐름을 리 용함으로써 
기 억기와 처 리 장치사이의 결합대 역폭을 증가시 킨다. 

설계의 조건으로 되는 또 하나의 부분은 I/O 장치의 조종이다. 콤퓨터가 더 빠르고 
더 높은 능력 을 가질 때 집 중적 인 I/O 요구들로 주변장치 의 리용을 지 원 하는것 은 더 복 
잡한 응용프로그람들을 개발하게 한다. 표 2-7 에 개 인용를퓨터와 워크스테이션들에서 
리용하는 전형적인 주변장치들의 실례를 보여 주었다. 이 장치들은 핑장한 자료처리능력 
을 요구한다. 현 세대처 리장치들은 이 장치들에 의 하여 얻 어 진 자료들을 조종할수 있으 
며 처리장치와 주변장치사이에서 전송되는 자료를 받아 들이는 문제가 남는다. 여기서 
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DRAM , . , r , - , 一 r 

•크기 1 Mbit 4 Mbit 16 Mbit 64 Mbit 256 Mbit 

우세한 1 MX 1 1 MX 4 4 MX 4 ??? ??? 

구성들 256 KX 4 2 MX 8 

그림 2-12. DRAM 리 용추세 [ PRZY 94] 

략들은 고속결 합모선들과 모선들의 더 복잡한 구조를 리용하게 되 는 고속완충기 
:다. 추가로 다중처 리 장치구성 들을 리용하면 만족하는 I 八)요구를 도와 줄수 있 t 


표 2-7. 여 러가지 주변장치기술의 대표적 인 대 역폭요구 


주변장치 

기술 

요구되는 대역폭, Mbyte 

도형 표시 장치 

24 bit 색 

30 

국부망 

100 BASEX 혹은 FDDI 

12 

디 스크조종기 

SCSI 혹은 P 1394 

10 

비 데 오 

1024 X 768830 fps 

67+ 

"o 주변장치 

기 타 

5+ 


모든것 들의 기 본은 균형 을 보장하는것 이 다. 설계 가들은 처 리 장치구성 요소인 주 
I/O 장치 그리 고 호상결 합구조들의 처 리 능력 과 처 리 들의 균형 을 보장하기 위하 
. 이 노력한다. 이 설계 는 끊임 없 이 발전하는 다음과 같은 두가지 요인들에 대 처 
하여 연구되여 야 한다. 

여러가지 기술분야(처리장치，모선들，기억기，주변장치들)들에서의 성능의 변 
속도는 요소들의 형태에 따라 각이하다. 

전형적인 명령형식과 자료접근방식에서 체계에 대한 요구의 내용들이 새로운 응 
프로그람들과 새로운 주변장치들이 나옴에 따라 부단히 변한다. 




제 3 절 . Pentium 과 PowerPC 의 발전 

이 책에는 콤퓨터의 개념과 대량생산을 설명하기 위하여 콤퓨터설계와 실현에 대한 
구체적인 실례들을 많이 주었다. 이 책에서 취급하는 대부분의 실례는 두개의 를퓨터계 
렬 즉 Intel 의 Pentium 과 PowerPC 이 다. Pentium 에서는 복합명 령모임를퓨터 (CISC) 
들에서 10 년동안 설계노력의 결과를 고찰한다. CISC 는 그 설계의 우수한 실례들로서 대 
형 콤퓨터 들과 슈퍼콤퓨터 들，봉사기 들의 정 교한 설계 원리 들을 통합하고 있 다. PowerPC 
는 첫 RISC 체계 인 IBM8()1 의 직접적 인 계승이며 가장 위 력 하고 가장 설계 가 잘된 RISC 
에 기초한 체계로서 인기가 높다. 

이 절에서는 두 체계를 간단히 고찰한다. 

1. Pentium 

인텔은 10 여년동안 극소형 처 리 장치 들을 만들어 온 제 일 가는 제 작회 사였다. 인텔 이 처 
음으로 극소형 처 리 소자제 품을 개 발함으로써 콤퓨터 기 술발전의 훌륭한 개 척 자로 되 였 다. 

표 2-6 은 그 발전을 보여 주고 있다. 흥미 있는것은 극소형처리장치가 빨리 발전할 
수록 더 욱더 복잡해 진다는것 이 다. Intel 은 실제적 으로 가장 높은 수준에 올라 섰다. 인 
텔은 매 4 년마다 새로운 형의 극소형처리장치들을 개발하군 하였다. 그러나 Intel 은 개 
발기 간을 1 생 년으로 정하여 경쟁 자들을 이기 려고 하였으며 3 개의 최 신형펜터움계 렬들을 
내놓았다. 

Intel 제품계렬의 발전과정은 다음과 같다. 

• 8080： 세 계 에 서 첫 일 반목적 처 리 장치 이 다. 8080 은 8bit 처 리 장치 이 다. 8080 은 첫 
개 인용콤퓨터 Altair 에 리 용되 였 다. 

• 8086： 더 능률이 높은 16bit 처 리장치이 다. 적은 량의 명 령들을 실행 하기전에 미 
리꺼내기하여 놓을수 있는 명령캐쉬 즉 기다림렬을 장비하였다. 이 처리소자의 변 
종인 8088 은 Intel 이 확고히 성 공할수 있게 한 IBM 의 첫 개 인용콤퓨터 에 리 용되 
였 다. 

• 80286: 8086 의 확장으로서 1Mbyte 대 신에 16Mbyte 주소화가 가능하다. 

• 80386： Intel 의 첫 32bit 처 리 장치이 며 기 본적 으로 높은 수준에서 검 사된 제 품이 
였 다 . 32bit 구성 방식 으로서 80386 은 이 미 몇 년전에 소개 된 소형콤퓨터 와 대 형 콤퓨 
터의 복잡성과 능력에 대한 경쟁을 하였다. 80386 은 여러개의 프로그람을 동시에 
실행 하는 다중과제처 리를 지원하는 첫 Intel 처 리 장치 였다. 

• 80486： 80486 은 더 고급하고 정교한 캐쉬기 술과 고급한 명령 관흐름조종의 리 용을 
도입하였 다. 또한 기 본 CPU 로부터 복잡한 산수연산을 다른데 로 넘 겨 주지 않고 
실 행하도록 수값연산협 동처 리 장치 를 장비하였 다. 

• Pentium ： Pentium 에서 Intel 은 병렬로 여러개의 명령을 실행하게 하는 고속스칼 
라기술을 리용하였다. 

• Pentium Pro : Pentium Pro 는 Pentium 으로부터 시 작된 고속스칼라구성 에 로의 이 
행 을 계승하였 으며 또한 등록기이 름바꾸기 , 분기예 측，자료흐름분석 과 투기 적 인 
실행을 추가하였다. 
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• Pentium II: Pentium II 는 비데 오，음성과 도형 자료들을 능률적으로 처 리 하도록 
특수하게 설계된 Intel 의 MMX 기술을 추가하였다. 

• Pentium m : Pentium III 과 3 차원도형 처 리 프로그람을 지 원하는 추가적 인 류점 수명 
령들을 첨부하였다. 

• Merced： Intel 처 리장치의 이 새로운 세대는 64 bit 연산을 진행하게 하였다. 

2. PowerPC 

1975년에 IBM 에서 계획한 8()1 소형콤퓨터는 RISC 체계에서 리용되는 많은 구성방식 
의 개념들을 개척하였다. 8()1 은 Berkeley RISC I 처리장치와 함께 RISC 구상을 내놓았 
다. 그러 나 801 은 설계 구상을 립 증하는 정 도의 간단한 모형이 였 다. 1986 년에 개 발한 
RTPC 실제제 품에서 는 8()1 방식 의 구상들을 실현하였 다. RTPC 는 상품화되 지 못하였으 
나 비 교할수 있을 정 도로 더 좋은 성 능을 가지 였다. 1990 년에 IBM 은 8()1 과 RT PC 의 
교훈으로부터 구축된 세번째 체계를 생산하였다. IBM RISC system /6000 은 조금후에 개 
발된 고성능워 크스테 이 션으로서 판매된 좋은 고속스칼라처 리소자인 RISC 였다. 이것을 
IBM POWER 구성 방식 으로 부르기 시 작하였 다. 

다음단계 를 위하여 IBM 은 68000 계 렬의 극소형 처 리 장치 들을 개 발한 Motorola 와 
Macintosh 를퓨터 에 Motorola 소편을 리용한 Apple 콤퓨터를 결합시 켰다. 그 결과가 
POWERPC 를 실 현 한 처 리 장치 계 렬이 다. 이 구성 방식 은 POWER 구성 방식 으로부터 유 
래되였다. 변화시킨것은 일부 명령들을 없애고 일부 까다로운 경우들을 없애기 위한 기 
술적요구들을 약화시킴으로써 기본적으로 있어야 할 기능들을 추가하고 더 효률적으로 
실현할수 있도록 하였다. 결과 Power PC 방식은 RISC 체계이다. Power PC 는 수백만 
대의 Apple Macintosh 콤퓨터와 많은 소편응용에 리용된다. 후자의 실례는 다중콤퓨터 
관련회사의 가동환경을 가진 사용자들에게 일반관리접근을 제공하는 망설비에 꽃을수 있 
는 IBM 계 렬 의 망관리 소편 이 다. 

아래 에 는 PowerPC 계 렬의 기 본형 들을 주었 다(표 2-8). 


표 2-8. PowerPC 처 리 장치개괄 



601 

601/603e 

604/604e 

740/750 (G3) 

G4 

첫 생산년도 

1993 

1994 

1994 

1997 

1999 1 

주기 속도 (MHz) 

50-120 

100-300 

166-350 

200-366 

500 

캐쉬 


16 kbyte 명 령 
16 kbyte 자료 

32 kbyte 명 령 
32 kbyte 자료 

32 kbyte 명 령 
32 kbyte 자료 

32 kbyte 명 령 
32 kbyte 자료 

L2 2 차 
캐쉬 지원 




256 kbyte~lM 

byte 

256 kbyte-lM 

byte 

3 극소자수 
(10 6 ) 

2.8 

1.6-2. 6 

3.6-5.1 

6.35 



• 601: 601 의 목적은 될수록 빨리 시 장에 PowerPC 구성 방식 을 보급하는것 이 다. 601 
은 32 bit 처 리 장치 이 다. 

• 603： 낮은 탁상형 과 휴대 형 콤퓨터 로서 역 시 32 bit 처 리 장치이 며 601 과 성 능에 서 
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비슷하다. 그러나 더 가격 이 눅으며 더 능률적 이다. 


• 604： 탁상형과 말단봉사기를 위한것이다. 이것은 32 bit 콤퓨터이며 더 높은 성능을 
가지도록 하기 위하여 더 현대적인 고속스칼라설계기술을 리용하였다. 

• 620： 높은급봉사기 용이다. 64 bit 자료통로를 가지 는 완전한 64 bit 구성 방식 을 실현 
한 첫 PowerPC 계 렬번호이다. 

• 740/740: G 3 처 리 장치 로 알려 졌다. 이 처 리 장치는 한 소편에 2 준위 캐쉬 를 집적 하 
고 있으며 무소편캐쉬구성 인 처 리장치들에 비하여 충분히 성능을 개선하였다. 

• G 4： 이 처 리장치는 처 리장치소편의 내부속도와 병렬처 리기술을 더욱 높이였다. 
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Web 싸이트 : 

• Chari Babbage Institute : 콤퓨터의 력 사를 취급하는 여러 개의 
Web 싸이트에 대한 련결을 준다. 


• Power PC ： Power PC 에 대 한 IBM 의 홈폐지 


• Developer Home ： 개 발자들을 위 한 인텔의 Web 폐지 : Pentium 
정보를 접근하기 위한 시작점을 준다. 


련습문제 

1. C ( I )= A ( I )+ B ( I ) 를 구하기 위 한 1000 개의 마디를 가지는 1 차원 A = A (1), A 松)…… 
A (1000) 4 B = B (1), B (2) …… B (1000) 이 있다. IAS 명령모임을 리용하여 이 문제 
를 풀기 위한 프로그람을 작성 하시 오. 

2. IBM 360 형 은 65 와 75 에서 주소는 두개 의 갈라 진 주기 억 기 에서 왔다 갔다한다 

(즉 우수주소는 한 기억기, 기수주소는 다른 기억기에). 이 기술의 목적은 무 
엇 인 가? 
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제 2 편. 콤퓨터체계 


제 2 편의 중심 

콤퓨터체 계는 처 리장치，기 억기 , I/O 그리고 기본구성 요소들사이의 호상접속으로 이 
투어 져 있다. 제 2 편에서는 이 구성요소중 제 3 편에서 취급되는 가장 복잡한 처리장 
치를 제외한 나머지부분들에 대 하여 상세 히 고찰한다. 

제 2 편에서 는 두가지 기 본문제 를 론의 한다. 

제2 편의 장별 내용 

제 3 장. 체계모선 

콤퓨터체계 에서 매 개 기 본구성요소들의 총체적 인 기능，호상접 속구조，그것 들사이 
에 교환되는 신호형태들을 정의하는것은 콤퓨터체계에 대한 가장 높은 준위의 서술이다. 
제 3 장에서는 호상접속구조와 그 구조를 리용한 신호교환에 대하여 고찰한다. 콤퓨터체 
계 의 기 본구성 요소들을 호상접 속하는 가장 일 반적 인 수단들은 체 계 모선 이 나 모선묶음이 
며 이것 이 바로 제 3장의 중심 이 다. 또한 이 장에서 는 호상접속설계 에 영 향을 주는 기 본 
지표들，특수하게 새치기를 지원하는 요구들을 고찰한다. 

제 4 장. 내부기억기 

이 장에서는 주기억기의 구성과 성능을 높이기 위 한 캐쉬전략의 리용에 대 하여 고 
찰한다. 주기억기체계의 설계는 큰 기 억용량，짧은 접근시 간, 저 가격과 갈은 세가지 
경제적 인 설계요구들사이의 끊임 없는 충돌과정이 다. 기 억기 기술의 발전에 따라 이 3 가 
지 특성들은 계속 변화하므로 주기억기 구성 에서 설계지도서들을 새 롭게 작성 하고 검 사 
하여 야 한다. 제 4장에 서 특별히 강조된 두개 의 련관되 는 부분은 캐 쉬 구성 과 DRAM 을 
위한 여 러 가지 방안들이다. 

제 5 장. 외부기억기 

주기억기 에서 리용할수 있는것보다 실제 로 큰 기 억용량을 가지며 더 영구적 으로 
기 억할수 있는 외부기 억기를 구성할것을 요구한다. 가장 널리 리용되는 외부기 억기의 
형 태 는 자기 디 스크이 며 제 5 장에 서 는 대 부분 이 것 을 기 본으로 취 급한다. 첫째 로，자기 디 
스크기 술과 설 계 를 고찰한다. 둘째 로，디 스크기 억 기 성 능을 개 선 하기 위 한 RAID 구성 의 
리 용을 고찰한다. 또한 제 5 장에 서 는 빛 기 억 기 와 자기 레 프도 고찰한다. 

제 6 장. 입출력 

제 6 장에서는 I/O 구성의 여러가지 형태를 기본적으로 고찰하였다. 이 부분은 복잡 
하므로 요구하는 성 능을 만족시 키 기 위한 를퓨터체 계 설계 의 다른 부분들보다 리해 하기 
어렵 다. 제 6 장에서는 프로그람식 I / O , 새치기 I / O , 직접접근 ( DMA ) 의 기술들을 리용함 
으로써 I/O 장치가 콤퓨터체계의 휴식상태들을 서로 리용할수 있게 하는 기구들을 고찰 
한다. 또한 I 八)장치 와 외 부장치 사이 대 면부를 고찰한다. 
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제 7 장. 조작체계 

조작체계에 대한 상세한 설명은 이 책에서 하지 않는다. 그러나 조작체계의 기본기 
술을 리해하며 요구하는 성능을 얻기 위하여 OS 가 하드웨어를 어떻게 잘 리용해야 하 
는가 하는것 을 알아야 한다. 제 7장은 조작체 계 의 기 본원리 와 조작체 계 지 원을 위한 콤퓨 
터하드웨 어 의 특수한 설 계 특성 을 서 술한다. 


제 3 장. 체계모선 



♦ 명령주기는 명령꺼내기, 0 이상의 연산수꺼내기，0 이상의 연산수기 억，새치기검사(만 
일 새치기가 가능하다면)로 구성된다. 

♦ 기 본콤퓨터 체 계 구성 요소 (처 리 장치，주기 억 기， I/O 장치 ) 들은 자료와 조종신호들을 교 
환하는 순서대로 서로 접속될것을 요구한다. 호상접속의 가장 일반적인 방법은 여러 
개의 선들로 구성된 공유된 체계모선을 리용하는것이 다. 현대체계들에서는 일반적으 
로 성능개선을 위하여 모선들의 계층화를 실현한다. 

♦ 모선을 위한 기본설계요소에는 중재 (모선에 신호들을 보내는 허가를 중심적 혹은 분 
산적방법으로 조종하는), 동기 (모선에서의 신호들이 중심박자에 동기되든지 혹은 가 
장 최근의 전송에 기초하여 비동기적으로 전송하든지)，모선폭(주소모선의 수와 자 
료모선의 수)이 속한다. 










높은 준위 에서 고찰할 때 콤퓨터는 CPU , 기 억 기 그리 고 I/O 구성요소들을 하나이상 
씩 가지고 있다. 이 구성요소들은 프로그람을 집행하기 위한 콤퓨터의 기본기능들을 수 
행하도록 여러가지 방법으로 호상 접속된다. 따라서 콤퓨터체계를 높은 준위에서 고찰 
하려면 (1) 구성요소들의 외적인 거동 즉 다른 구성요소들과 자료와 조종신호들의 호상 
교환 (2) 이 구성요소들의 호상간 접속구조로 나누어 서술할수 있다. 

높은 준위 에 서 구조와 기 능을 고찰하는것 은 콤퓨터 의 본질 을 리 해하는데 서 설득력 이 
있는것 으로 하여 중요하다. 성 능평 가의 복잡한 항목들을 하나씩 하나씩 리해 해 나가는 
것도 역시 중요하다. 높은 준위의 구조와 기능을 파악하면 체계성능제한요소，어떤 요 
소가 고장났을 때 에 바꾸어 리용할수 있는 여 러 가지 통로，체 계 고장의 범위를 인차 알 
수 있게 하며 성능을 추가적으로 강화할수 있다. 많은 경우에 체계의 위력과 고장안정 
성을 높일데 대한 요구는 단순히 개별적구성요소들의 속도와 믿음성을 증가시키는 방법 
으로가 아니라 설계를 변화시키는 방법으로 만족시킨다. 

이 장은 콤퓨터구성 요소들의 호상접 속에 리용되 는 기 본구조를 중심 으로 고찰한다. 
이 장에 서 는 기 본구성 과 그것 들사이 의 호상접 속요구들을 간단히 고찰하는것 으로부터 시 
작한다. 그다음에 기능들을 고찰한다. 

다음으로 체계구성요소들을 호상 접속하기 위한 모선들의 리용을 고찰한다. 


제 1 절. 콤퓨터구성요소 

제 2장에서 론의 한것 처 럼 실제 적 으로 모든 현대를퓨터 설계 들은 존 폰 노이 만에 의하 
여 개발된 개념들에 기초하고 있다. 이 설계는 폰 노이만방식으로 알려 져 있는 몇가지 

기본개념에 기초한다. 

• 자료와 명 령들은 하나의 
읽기/쓰기기억기에 기 
억된 다. 

• 이 기억 기의 내용들은 
거기에 포함된 자료형 
식에 관계없이 위치에 
따라 주소화된다. 

• 실행은 임의의 명령으로 
부터 다음명령에로 순 
차적인 방법으로 진행 
한다. 

이 개념들을 제 1 장에서도 
고찰하였으나 여기서 간단히 고 
찰한다. 이것은 2 진수자료를 기 
억하며 그 자료에 대 하여 산수 
연산과 론리연산을 수행할수 있 
게 여러가지 방법들로 련결할수 
있 는 기본론리적구성 요소들의 
작은 모임이다. 만일 특수한 계 
산을 집 행하여 야 한다면 이 계 
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전용화된 
하드웨어 


산수-론리 연산 
기능들의 렬 



그림 3-1. 하드웨어와 쏘프트웨어의 접근방법 
n- 하드웨어에서 프로그람화，1■-쏘프트웨어에서 프로그람화 






산을 위하여 특수하게 설계된 론리적구성요소들을 배렬할수 있다. 프로 그람작성의 형식 
에 따라 요구되 는 배 렬 에서 여 러 가지 구성 요소들을 호상 련결 하는 파정 을 생 각할수 있 
다. 결과 《프로 그람》 은 하드웨 어형 이며 하드웨어 프로그람이 라고도 한다. 

이제 이것들중 어느 하나를 고찰하자. 산수론리기 능의 일반배 렬을 구성한다고 하자. 
하드웨어의 이 묶음은 하드웨어에 적용된 조종신호들에 의존하는 자료들에 대한 여러가 
지 기능을 수행한다. 전용화된 하드웨어였던 최초의 경우 체계는 자료를 받아 들여 결 
과를 만든다(그림 3-1 1). 일반용하드웨어에서 체계는 자료와 조종신호를 받아 들이고 
결과를 생 성한다. 따라서 매 개의 새 로운 프로그람을 위한 하드웨 어 의 재 배 선대신에 프 
로그람작성 자는 단지 새 로운 조종신호선묶음을 공급할것 을 요구한다. 

얼마나 적은 조종신호들이 공급되는가? 대 답은 간단하다. 그러 나 명백치 않다. 전 
반적인 프로그람은 실제적으로 집행단계의 순서이다. 매 단계에서 조종신호의 새로운 
묶음들이 요구된다. 조종신호의 가능한 모든 모임들을 위한 유일코드를 제공하고 이 코 
드를 입 력 하여 조종신호를 발생하는 부분을 일반용하드웨 어 에 추가한다(그림 3-1 1-). 

프로그람작성은 오늘에 와서 더 쉬워 졌다. 매 번 새 로운 프로그람을 위하여 하드웨 
어를 교체하지 않고 새로운 코드렬을 제공하기만 하면 된다. 결과 매개 코드는 명령이 
며 하드웨 어의 부분은 매 명 령을 해석하여 조종신호를 발생한다. 프로그람작성의 이 새 
로운 방법을 구별하기 위하여 코드들의 렬즉 명령을 쏘프트웨어라고 한다. 

그림 3-1 i •는 체 계의 두 중요구성요소 즉 명 령해석기 와 일반목적산수-론리기능장 
치 를 보여 준다. 이 두개 가 CPU 를 구성 한다. 그리 고 콤퓨터 가 기 능을 수행하도록 하기 
위하여 이밖의 몇 가지 구성요소들이 더 요구된다. 자료와 명 령들이 체계 에 넣 어 져 야 
한다. 이를 위하여 몇가지 종류의 입력장치가 필요하다. 이 장치는 어떤 형태로 자료와 
명 령을 입 력하고 체 계 에서 리용할수 있는 신호의 내부형식으로 변환하기 위한 기본구성 


I/O 장치 


PC = 프로그람계수기 
IR = 명령등록기 
MAR = 기억기주소등록기 
MBR = 기억 완충등록기 
I/O AR = I/O 주소등록기 
I/O BR = I/O 완충등록기 



pc 

| mar 1 


1 IR 1 

I MBR | 


|l/0 AR | 


|l/0 BR | 


기억기 


그림 3-2. 를퓨터구성요소:웃준위고찰 
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요소들로 이루어 진다. 또한 결과를 보고하는 수단이 요구되는데 이것은 출력장치에 의 
하여 실현된다. 바로 이 두개를 합쳐 I八)구성요소 이 라고 한다. 

또 하나의 구성요소이 요구된다. 입력장치는 련달아 명령과 자료를 나른다. 그러나 
프로그람은 변함없이 차례로 집행되지 않는다. 즉 이행이 가능하다(실례로 IAS 이행명 
령 ). 마찬가지 로 자료에 대 한 연산도 미 리 정한 순서 로 한번에 한개요소이상을 접근할 
것을 요구한다. 따라서 명 령과 자료들을 림시적 으로 기 억시키기 위한 공간이 있어 야 한 
다. 이 장치 를 외 부기 억 기 혹은 주변장치 들과 구별 하기 위하여 기 억 기 혹은 주기억 기 라 
고 한다. 폰 노이만은 하나의 기억기가 명령과 자료를 둘다 기억하게 하였다. 

그림 3-2 는 높은 준위 구성 요소들과 그것 들사이 의 호상작용을 보여 준다. CPU 는 기 
억 기 와 자료를 교환한다. 이 를 위하여 일 반적 으로 CPU 내 에 있는 두개 의 내 부등록기 즉 
다음의 읽 기 나 쓰기 를 위 하여 기 억 기 주소를 지 정 하는 기 억 기 주소등록기 ( MAR ) 와 기 억 
기 에 써 질 자료를 가지 거 나 기 억 기 로부터 읽 은 자료를 받는 기 억 기 완충등록기 ( MBR ) 를 
리 용한다. 마찬가지 로 I 八3주소등록기 ( I 八) AR ) 는 개 별적 인 I 八)장치 를 지 적한다. I 八)완 
충등록기 는 I 八)장치 와 CPU 사이 에 자료를 교환하기 위하여 리 용한다. 

기억기모둘은 위치들의 묶음으로 이루어 지며 차례로 번호가 불은 주소들로 정의된 
다. 매개 위치는 명령이나 자료로 해석될수 있는 2 진수를 가지고 있다. I 八)장치는 외부 
장치 로부터 CPU 와 기 억기 에 로 혹은 CPU 와 기 억기 에서 외부장치에 로 자료를 전송한다. 
이 장치는 목적지 에 자료를 전송할 때 까지 이것을 림시 적 으로 유지 하기 위한 내부완충 
기를 가지고 있다. 

여기서는 기본구성요소들에 대한 간단한 고찰과 함께 이 구성요소들이 프로그람들 
을 어떻게 집행시키는가를 개괄한다. 


제2 절. 콤퓨터의 기능 

콤퓨터에 의하여 수행되는 기본기능은 기억기에 기억된 명령들의 모임으로 구성된 
프로그람에 의하여 집행된다. 처리장치는 프로그람에 지적된 명령들을 실행함으로써 실 
제적으로 일을 한다. 이 절에서는 프로그람집행의 기본요소들을 고찰한다. 가장 간단한 
형태는 명령처리가 두 단계로 이루어 진 경우이다. 즉 처리장치는 한번에 기억기로부터 
명령을 꺼내며 매 명령을 실행한다. 프로그람집행은 명령꺼내기와 명령실행의 반복으로 
이루어 진다. 명령실행은 여러가지 연산을 포함하며 명령의 내용에 관계된다(실례로 그 
림 2-4 의 아래 부분 참고) . 


꺼내기주기 실행주기 


요 ' |_- 명령실행 卜七 D 


48 


그림 3-3. 기본명령주기 




한개의 명령을 처리하기 위하여 요구되는 시간을 명령주기라 고 한다. 앞에서 고찰한 
간단한 두 단계의 분류를 리용하면 명 령주기 화는 그림 3-3 에서 와 같이 주어 진다. 두 
단계를 꺼내기주기와 집행주기라 고 한다. 프로그람집행은 처리장치가 동작하지 않을 때 
와 일부 치명적인 고장이 발생하였을 때 혹은 콤퓨터를 정지시키는 명령이 실행되고 있 
는 동안 정지된다. 

1. 명령꺼내기와 실행 

매 명 령 주기 가 시 작되 면 처 리 장치 는 기 억 기 로부터 명 령 을 꺼 낸 다. 일 반적 인 처 리 장치 의 
프로그람계수기 ( PC ) 는 다음에 꺼낼 명령의 주소를 가지고 있다. 다시말하여 처리장치는 다 
음명령을 순서대로 꺼내기 위하여 매 명령을 꺼낸후에 PC 를 항상 증가시킨다. 그러한 실례 
토서 매 명령이 기억기의 16 bit 단어를 차지하는 콤퓨터를 고찰하자. 프로그람계수기가 위치 
300 으로 설정 되 였다고 가정 하자. 계속되는 명 령 주기 에서 처 리 장치 는 301，302，303 등의 위 
치로부터 명령들을 꺼낼수 있다. 이 순서는 앞으로 설명되는것처럼 변화된다. 

꺼내여 진 명령은 명령 등록기 ( IR ) 로 알려 진 처 리 장치 의 등록기 에 넣어 진 다. 명령 
은 처 리 장치 가 가지 고 있는 동작을 지 적 하는 비 트들을 가지 고 있 다. 처 리 장치 는 명 령 을 
해 석 하고 요구되 는 동작을 실행한다. 일반적 으로 이 동작들은 4개의 종류로 규정된다. 

• 처 리 장치 -기 억 기 : 자료는 처 리 장치 로부터 기 억 기 로，기 억 기 로부터 처 리 장치 까지 
전송된다. 

• 처리장치 -I 八): 자료는 처리장치와 I/O 장치사이의 자료전송으로서 주변장치에로 
또는 주변장치로부터 전송된다. 

• 자료처 리 : 처 리 장치 는 자료에 대 하여 일 부 산수 혹은 론리연산을 수행한다. 

• 조종: 어떤 명 령은 실행 순서 가 변하도록 지 적한다. 실례 로 처 리 장치 가 다음명 령 이 
위치 182에 있다는것을 지적하는 149위치의 명령을 꺼냈다고 하자. 처리장치는 182 
로 PC 를 설정 함으로써 이것 을 실행한다. 따라서 다음꺼 내 기 주기 에서 명 령은 150 
이 아니 라 위치 182로부터 꺼내여 진다. 

하나의 명령의 실행은 이 동작들의 접속을 다 포함한다. 


0_ 3 4 


| 조작 3 드 | 

주 

소 — 1 

0 1 

-0 

LU _ 

크 

기 ] 


프토그람계수기 (PC): 명령의 주소 
명령등록기 (IR): 실행되고 있는 명령 
축적기 (AC): 림시기 억기 

0001:기억기의 내용을 축적기에 넣기 
0010:기억기에 축적기의 내용기억 
0101:기억기의 내용을 축적기에 더하기 

H) 

그림 3-4. 가정적인 기계의 특징 

명령형식，옹근수형식，내부 CPU 등록기, ᄅ-조작코드의 실례 
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• 연산수주소계산 ( oac ): 연산이 기 억기 혹은 I/O 를 통하여 연산수의 참조를 가진 
다면 연산수의 주소를 결정한다. 

• 연산수꺼내기 ( of ): 기억기로부터 연산수를 꺼내거나 1/◦로부터 연산수를 읽는다. 

• 자료연산 ( do ): 명령에서 지적된 연산을 지정한다. 

• 연산수기 억 ( os ) : 기 억 기 에 결과를 쓰거 나 I/O 로 출력 한다. 

그림 3-6 의 앞부분에서 상태는 처리장치와 기억기 혹은 1/◦장치사이의 교환을 반영 
한다. 그림의 뒤부분에서 상태는 처리장치연산을 반영한다. oac 상태는 명령 이 읽기，쓰 
기 혹은 둘 다 포함할수 있으므로 두가지를 나타낸다. 그러 나 이때 수행되는 동작이 두 
경우에 대하여 상태가 갈으며 따라서 하나의 상태로 통일시 킬것을 요구한다. 

또한 그림은 같은 처리장치에서 일부 명령이 다중연산수，다중결과를 요구하므로 
이 것을 실행 할수 있게 반영 하였다. 실례 로 PDP -11 명 령 ADD A , B 는 상태들의 다음의 
순서 즉 iac, if, iod, oac, of, oac, of, do, oac, os 를 나타낸다. 

결국 갈은 처 리 장치 에서 한개의 명 령은 문자들의 렬 혹은 수들의 벡토르로 수행되 
는 연산을 지적할수 있다. 그림 3-6 에 보여 준것처럼 이것은 연산수의 꺼내기와 보관에 
대한 연산들을 반복할수 있다. 

2. 새치기 

실제 적 으로 모든 콤퓨터 들에는 다른 장치 ( I 八), 기 억 기) 가 처 리 장치 의 일 반적 인 순서 
를 새치기하도록 하는 기구들이 있다. 표 3-1 은 가장 일반적인 새치기종류를 보여 준다. 
이 새 치 기들에 대 한 명백 한 고찰은 이 책의 뒤부분에서 진행하며 특별히 제 6 장과 제 11 
장에서 론의한다. 그러 나 지금은 명 령실행의 내용과 호상접속구조에서 새 치 기들의 밀접 
한 관계를 더 명백히 리해하기 위한 개념만을 고찰한다. 독자들은 새치기들의 발생과 
처리의 세부에 대한 단계들을 알고 있으므로 새치기로부터 초래되는 장치들사이의 통신 
을 기본으로 하여 고찰한다. 

새 치기는 기본적으로 능률적 인 처 리를 제공하기 위한 수단으로 리용된다. 실례 로 대 
부분 외 부장치 들은 처 리 장치 보다 속도가 뜨다. 처 리 장치 가 그림 3-3 의 명 령 주기단계 들 
을 리용하여 인쇄 기 에 자료를 전송하고 있 다고 가정 하자. 매 쓰기연산후에 처 리 장치 는 
정지되여 야 하며 인쇄기가 자료를 받을 준비가 될 때까지 휴식상태를 유지하여 야 한다. 
이 정지시간의 길이는 기억기를 포함하지 않는 명령주기를 수백 혹은 수천개 실행할수 


표 3-1. 새치기의 종류 
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있 다. 명백히 이것은 처 리 장치 의 사명 을 무의 미 하게 한다 . 

그림 3-7 1에 요인사건들의 상태 를 설 명하였 다. 사용자프로그람은 처 리 도중에 삽 
입하는 WRITE 접근렬을 수행한다. 코드토막 1，2 와 3은 I / O 를 포함하지 않는 명령들 
의 순서렬이 라고 할수 있다. WRITE 접근들은 체 계봉사프로그람이 며 실제 로 I 八) 조작을 
진행하는 I 八)프로그람을 접근한다. I 八)프로그람은 세 개의 부분으로 구성된다. 

• 그림에서 4로 표시된 실제적인 I / O 조작을 준비하기 위한 명령들의 렬. 이것은 지 
정된 완충기 에 로 출력하기 위한 자료복사와 장치 에 지 령을 주기 위한 파라메터 들 
의 준비를 포함한다. 

• 실제적인 I/O 명령. 새치기의 리용이 없이 이 지령이 일단 집행되면 프로그람은 
요구되 는 기 능을 수행 하기 위한 I/O 장치 를 위하여 기다려야 한다. 프로그람은 
I/O 조작이 완료되 였는가를 결정 하기 위한 검 사연산을 반복적 으로 수행하면서 기 
다려 야 한다. 

• 그림에서 5 로 표시된 명령들의 렬. 이것은 연산을 완성하기 위한것이다. 즉 연산 
이 성 공인가 실패 인가를 지 적하는 기 발설정 을 진행한다. 

I 八) 조작은 완료될 때 까지 상대 적 으로 오랜 시 간이 걸 리 므로 I 八) 프로그람은 연산이 
완성 될 때 까지 오래 기다려야 한다. 결 국 사용자프로그람은 많은 시 간 WRITE 접 근의 
점에서 정지된다. 

새치기와 명령주기 

새 치기로 I/O 조작을 진행하는 동안 처 리 장치 가 다른 명 령들을 실행하도록 하게 할 
수 있다. 그림 3-7 l 에서 조종흐름을 고찰하자. 앞에서 처 럼 사용자프로그람은 WRITE 
접근형식으로 체계접근을 진행하는 위치에 도달한다. 이 경우에 I/O 프로그람은 준비코 
드와 실제 I 八)명령을 불러 낸다. 이 적은 명령들이 실행된후에 조종은 사용자프로그람에 
로 돌아 온다. 한편 외부장치는 콤퓨터기억기 로부터 자료를 접수하여 그것을 인쇄하는 
동작을 진행한다. I 八)조작은 사용자프로그람에서 명 령들의 실행과 동시 에 진행된다. 

외부장치가 봉사될 준비가 되면 즉 처리장치로부터 자료들을 접수할 준비가 되면 
그 외부장치를 위한 I/O 장치는 처 리 장치 에 새 치기요구신호를 보낸다. 처 리 장치 는 현재 
프로그람의 연산을 중단하고 I/O 장치 를 봉사하기 위한 프로그람에 로 이 행하며 그 장치 
가 봉사된후에 원래의 실행 을 다시 하게 된다. 이와 갈은 새 치 기들이 발생한 시점은 그 
림 3-7 l 에서 별표로 표시 되 였다. 

사용자프로그람의 준위에서 고찰해 보면 새치기는 집행의 일반순서에 대한 중단이 
다. 새치기처리가 완성되였을 때 집행은 원래프로그람에로 되돌아 간다(그림 3-8). 따 
라서 사용자프로그람은 새 치 기들을 조종하기 위한 어떤 지적된 코드를 포함하지 않아도 
된다. 즉 처리장치와 조작체계는 사용자프로그람을 중단시키고 그다음 같은 위치에로 
되돌려 보낸다 

새 치 기를 조종하기 위하여 새 치 기주기는 그림 3-9 에서 보여 주는것 처 럼 명 령주기 에 
포함된다. 새치기주기에서 처리장치는 어떤 새치기가 발생하였는가를 검사한다. 만일 
새 치 기요구가 없다면 처 리 장치는 꺼 내기주기 로 넘 어 가며 현재프로그람의 다음명 령을 
깨낸다. 만일 새 치기요구가 접수되면 처 리 장치는 다음과 같이 동작한다. 

• 집행되고 있는 현재프로그람의 집행을 중지하고 그 내용을 보관한다. 이것은 집행 

을 계 속하기 위한 다음명 령 의 주소를 보관한다는것 을 의 미한다. 또한 처 리 장치 의 

현재동작과 관련 있는 다른 자료들도 보관한다. 
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• 프로그람계수기 는 새 치기처 리 프로그람의 시 작주소로 설정된다. 

처 리장치는 명 령꺼 내기주기 에로 넘 어 가며 새 치 기를 봉사하는 새 치기프로그람에서 첫번 
째 명 령 을 꺼 낸다. 새 치 기 처 리 프로그람은 일 반적 으로 조작체 계 의 부분프로그람이 다. 일 반적 
으로 이 프로그람은 새치기의 내용을 결정하며 요구되는 동작을 수행한다. 실례로 새치기처 
리프로그람은 어떤 I 八)장치가 새치기를 발생했다는것을 알면 그 I 八)장치에 더 많은 자료를 
쓰기할수 있는 프로그람에로 이행한다. 새치기처리프로그람이 집행을 끝냈을 때 처리장치는 
그 새 치기 처 리 프로그람으로부터 사용자프로그람집 행 으로 되돌아 가야 한다. 

이 처 리 에 일정 한 시 간이 걸 린다는것은 명백 하다. 특권명 령 들은 새 치기의 내 용을 
알기 위하여 또한 적 당한 동작을 결정 하기 위하여 실행된다. 이 로부터 I/O 조작에서 의 
단순한 기다림에 의하여 잃어 버리는 시간이 상대적으로 많으므로 처리장치는 새치기를 
리용하여 더 높은 능률을 낼수 있다. 


새치기조종기 


여기서 
새 치 기 발생 


그림 3-8. 새치기에 의한 조종이행 


꺼내기 주기 


실행주기 새치기주기 


1새치기금지 



그림 3-9. 새치기를 가진 실행주기 
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능률에 서 리 득을 고찰하기 위 하여 그 
림 3-7 자 와 그림 3-7 L 에서 조종흐름 
에 기초한 시간동기를 보여 준 그림 
3-10 을 고찰하자. 그림 3-7 l 와 그림 
3-10 은 I/O 조작을 위하여 요구되 는 시 
간이 상대 적 으로 짧다고 가정한다. 즉 
사용자프로그람에서 쓰기연산들사이의 
명 령실행 을 완성하는 시 간이 매 우 짧다. 
더 일반적인 경우 특히 인쇄기와 같은 
느린 장치에 대하여 I 八)조작은 사용자명 
령 들의 순차실 행보다 더 많은 시 간이 걸 
린다. 그림 3-7 도는 사건들의 이 상태 
를 보여 준다. 이 경우 사용자프로그람 
은 첫번째 접근에 의한 많은 I/O 조작이 
끝나기전에 두번째 WRITE 접근에 이르 
게 된다. 결과 사용자프로그람이 그 점 
에서 정지되게 된다. 진행중의 I/O 조작 
이 완성 되 면 이 새 로운 WRITE 접 근은 
처 리 되 며 새 로운 I/O 조작이 시 작된 다. 


. 니 

그림 3-10. 프로그람동기 : 짧은 I 八)기다림 
T - 새치기 없는 경우，새치기 있는 경우 

그림 3-11 은 새 치기리용이 없을 때의 이 
조건들에 대한 동기를 보여 준다. I/O 조 
작에 사용자명 령들의 실행과 겹처서 병 렬 
로 실행되면 이 겹치는 부분에 의하여 능 
틀이 높아진다는것을 알수 있다. 

그림 3-12 에 는 새 치 기 주기 처 리 과정 을 
포함하는 수정 된 명 령주기 상태 도를 보여 
주었다. 

다중새치기 

지 금까지 는 단일 새 치 기 의 발생 에 대 
해서만 고찰하였다. 그러 나 여 러개의 새 
치기가 발생한다고 가정하자. 실례로 프 
로그람은 통신선으로부터 자료를 받으면 
서 결 과들을 인쇄하여 야 한다고 하자. 인 
쇄기는 인쇄조작을 완성하는 때 마다 새 치 
기 를 발생할것 이 다. 통신선조종기 는 자료 
의 한개 단위가 도착할 때마다 새치기를 
발생할것 이 다. 자료단위 는 통신선로의 통 
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<D 

© 

처리장치 

기다림 
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~w 


처가다 t 1 1 1/0 조작 © 


처리장치 

기다림 

0 

® 

처리장치 

기다림 


I/O 

조작 


I/O 

조작 


그림 3-11. 프로그람동기 I 八) 기 다림 

1 - 새 치기 없음， - 새 치기 있음 
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야 한다. 만일 첫번째 입력묶음자료가 두번째 묶음자료가 들어 올 때까지 처 리하지 못 
하면 잃어 버러게 된다. 

두번째 방법은 새치기들에 대하여 우선권을 정의하고 낮은 우선권을 가진 새치기가 
처리되고 있는 경우에 더 높은 우선권을 가진 새치기를 처리하도록 허락하는 방법이다 
(그림 3-13 L ). 이 두번째 방법의 실례로서 세개의 I 八)장치들인 인쇄기，디스크, 통신 
선들로 이루어 진 체계를 고찰하자. 이 세개의 장치는 우선권이 2, 4, 5 로 주어 졌다. 
그림 3-14 는 가능한 처 리순서를 보여 준다. 사용자프로그람은 t =0 에서 시 작한다. t =10 
에서 인쇄 기새 치기 가 발생하며 사용자프로그람정보는 체계탄창에 보관되고 집 행은 인쇄 
기새치기봉사프로그람에로 넘어 간다. 이 처리프로그람이 계속 집행되고 있을 때 t =15 에 
서 통신새치기봉사프로그람 ( ISR ) 에로 넘어 간다. 이 봉사프로그람이 집행되고 있을 때 
t =20 에서 디 스크새 치기 가 발생한다. 이 새 치 기는 우선권이 낮으므로 당분간 유지 되 고 
통신 ISR 의 집 행 을 완료한다. 

통신 ISR 가 t =25 에 서 완료되 면 이 미 전의 처 리 장치 상태 가 인쇄 기 ISR 의 집 행 상 태 로 
회복된다. 그러나 이 프로그람의 한개 명령이 실행되기전에 처리장치는 더 우선권이 높 
은 디스크 새치기를 접수하고 디스크 ISR 에로 조종을 이행한다. 이 처리프로그람이 t =35 
에서 집행이 끝났을 때 인쇄기 ISR 가 다시 회복된다. 인쇄기 ISR 가 t =40 에서 집행이 
끝나면 사용자프로그람에로 되돌아 간다. 

3 . I/O 기능 

지 금까지 는 처 리 장치 에 의 하여 조종되 는 콤퓨터 연산에 대 하여 론의 하였 으며 처 리 장 
치와 기억기사이의 호상작용에 대하여 기본적으로 고찰하였다. 여기서는 I 八) 구성요소의 
역할에 대하여서만 본다. 이 역할은 제 6 장에서 상세히 고찰하므로 여기서는 간단히 개 
괄한다. 


사용자프로그람 인쇄기 ISR 통신 ISR 



어 떤 I/O 장치 (실례 로 디스크조종기 )는 직 접 처 리 장치 와 자료를 교환할수 있 다. 즉 
처 리 장치 는 기 억 기 와 읽 기 혹은 쓰기 를 진행할수 있지 만 특정 의 위 치주소를 지 적 하여 
처 리 장치는 I 八) 장치 로부터 자료를 읽거 나 I 八) 장치 에 자료쓰기를 할수 있다. 이 경우에 
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처 리 장치 는 특별 한 I/O 장치 에 의하여 조종되 는 주어 진 장치 를 지 적 한다. 따라서 명 령 
집 행 순서 는 그림 3-5 의 형 태 와 비 슷하며 기 억 참조명 령 대 신에 I 八) 명 령 을 사용할뿐이 다. 

일부 경우에는 I/O 가 기억기와 직접 자료를 교환할것을 요구한다. 이 경우에 I/O 
와 기 억 기사이의 자료전송이 처 리 장치 가 없이 진행할수 있게 처 리 장치는 I/O 장치 에 기 
억장치 에 대 한 읽기, 쓰기할수 있는 권한을 준다. 이렇게 전송하는동안 I 八) 장치가 기 억 
장치 에 읽 기 혹은 쓰기 지 령 을 주며 자료교환은 위한 처 리 장치 의 역 할을 덜 어 준다. 이 
조작은 직 접 기 억 접 근 ( DMA ) 라고 하며 제 6 장에 서 설 명 한다. 

제3 절. 호상접속구조 

콤퓨터는 구성요소들인 세개의 기본장치(처리장치, 기억기, I 八)장치)들의 모임으로 
구성된다. 실제적으로 콤퓨터는 기본장치들의 접속망이다. 따라서 장치들을 련결하는 
동로가 있어 야 한다. 

여러개의 장치를 련결하는 통로전체를 호상접속구조라고 한다. 이 구조의 설계는 
장치들사이에 이루어 져 야 하는 교환들에 의존한다. 

그림 3-15 는 매 개 장치 에서 입구와 출구의 기 본형 래들을 지적 하는데 요구되는 교환 
들의 형태들을 주었다. 


허 시 

기억기 

'단느 

계 

쓰기 


구스 1 y 

자■도 3 

r m ■ r n 


읽기 .1 


쓰기 r 

I/O 장치 

내부자료] 

신： ^ 

M 포구 

외부자료 

예■료 ) 


새 치 기 신호 



그림 3-15. 콤퓨터의 장치들 


• 기 억기 : 일반적으로 기 억기는 같은 
길이를 가지는 N 개의 단어들로 이루 
어 진다. 매 단어는 유일번호주소(0， 
1，…， N -1) 로 배렬된다. 자료단어는 
기억기에서 읽어 지거나 기억기에 써 
넣어 진다. 이 조작은 읽기 혹은 쓰 
기조종신호에 의하여 조종된다. 읽기， 
쓰기 위 치는 주소에 의 하여 규정된다. 

• I/O 장치 : 콤퓨터 체 계 의 견지 에 서 
보면 I 八)는 기억기와 류사하다. 즉 
읽기 혹은 쓰기 두가지 조작을 진 
행할수 있 다. 앞으로 I 八) 장치 는 여 
러개의 외부장치들을 조종한다. 포 
구를 통하여 외부장치에 대한 접속 
을 진행할수 있으며 포구는 유일 주 
소 (0, 1, …， M -1) 로 주어 진 다. 
또한 외부장치에 대한 자료의 입력 
과 출력을 위한 외부자료통로들이 
있 다. 끝으로 I/O 장치 는 처 리 장치 
에 새치기조종신호를 보낼수 있어 
야 한다. 

• 처 리 장치 : 처 리 장치 는 처 리 를 위 한 
명령과 자료의 읽기, 처러후의 자 

료쓰기를 진행하며 체계의 전반적 인 조작 
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을 위한 조종신호들을 내보낸다. 또한 새치기신호를 접수한다. 


우의 내용은 자료교환을 정의하였다. 호상접속구조는 다음과 갈은 전송형태들을 지원 
하여 야 한다. 

• 기억기로부터 처리장치에로 동작: 처리장치는 기억기로부터 명령과 자료단위를 
읽 는다. 

• 처러장치로부터 기억기에로의 동작: 처리장치는 기억기에 자료단위를 쓴다. 

• I/O 로부터 처 리 장치에 로의 동작 : 처 리 장치 는 I/O 장치 로부터 I/O 장치 를 거 처 
자료를 읽는다. 

• 처 리 장치 로부터 I/O 장치 에 로의 동작 : 처 리 장치 는 I/O 장치 에 자료를 보낸 다. 

• I 八 D 장치와 기 억기사이의 동작: I 八)장치로부터 기 억기 그리고 기 억기로부터 I/O 
장치에로의 두가지 동작에 대하여 I/O 장치는 처리장치를 거치지 않고 DMA 를 
리용하여 기억기와 직접 자료교환을 허락한다. 

몇년 지 나서 여 러개의 호상접속구조들이 나올것 이 다. 오랜기 간에 걸쳐 가장 공통적 
인것은 모선과 여러개의 다중모선구조이다. 이 장의 뒤부분에서는 모선구조들을 평가하 
였 다. 


제4절. 모선호상접속 

모선은 두개 이상의 장치들을 련결하는 통신로이다. 모선의 기본특징은 공유된 전송 
매체이다. 여러개의 장치들은 모선에 련결되며 임의의 어떤 장치에 의하여 전송된 신호 
는 모선에 접속된 다른 모든 장치들에 수신된다. 만일 두개의 장치들이 동시에 전송한 
다면 그 신호들은 겹치며 혼합된다. 따라서 오직 한순간에 한개의 장치만이 성과적으로 
전송할수 있다. 

일반적으로 모선은 여러개의 통신로들 혹은 선들로 구성된다. 매개 선들은 2 진수 1 
과 0으로 표시 되 는 신호를 전송할수 있 다. 오랜기 간 2진수자들을 전송하는데 하나의 선 
이 리용되였다. 실례로 자료의 8 bit 단위는 8개선으로 전송될수 있다. 

콤퓨터체계 들은 콤퓨터체계계층의 여 러 준위 들에서 구성요소들사이 에 경 로를 제공 
하는 여러가지 서로 다른 모선들을 가진다. 기본콤퓨터구성요소들을 련결하는 모선을 
체계모선이라고 한다. 대체 로 일반콤퓨터 의 호상접 속구조는 하나이상의 체 계모선의 리 
용하는데에 기초한다. 

1. 모선구조 

체 계 모선은 일 반적 으로 50-100 개 까지 의 분할된 선들로 구성 된 다. 매 개 선들에 는 독립 
적인 의미 혹은 기능이 할당된다. 비록 여러개의 서로 다른 모선들이 있다고 하더라도 임 
의의 모선에 있는 선들은 세개의 기능그룹(그림 3-16) 으로 분류된다. 즉 자료，주소，조 
종모선들이다. 추가적 으로 체 계안의 모둘들에 전원을 공급하는 전원선들이 있어 야 한다. 

자료 모선들은 체 계모둘들사이 에 자료를 전송하는 경 로를 제 공한다. 정 확히 말하면 
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이 선들을 자료 모선이라고 한다. 일반적 으로 자료모선은 자료 모선폭이라고 하는 8, 16, 
32 개의 분리된 선들로 이루어 진다. 매선은 한번에 lbit 를 전송하므로 선들의 수는 한 
번에 얼마만한 비트를 전송하는가를 결정한다. 자료모선의 폭은 총체적 인 체 계성능의 
기본요인이다. 실례로 자료모선이 8 bit 폭이고 매 명령이 16 bit 길이를 가진다면 이때 처 
리 장치는 2 배의 명령 주기 시간만큼 기억 기 장 치를 접근 하여 야 한 다 . 
주소모선은 자료모선에서 자료의 원천 혹은 목적을 지적하기 위하여 리용된다. 실 


CPU 기억기 **-| 기억기_ I/O | I/O 

IffTl 111 III JlUTl l ll ll I l ll ll I 

_ 조종모선 _ ᅮ， _ ll 

1 1111 수소고 Nl . . . L 


사료 1 


그림 3-16. 모선호상접속방법 


례로 만일 처리장치가 기억기로부터의 자료를 읽을것을 바란다면 주소모선에 요구하는 
단어의 주소를 내보낸다. 명백히 주소모선의 폭은 체계에서 최대로 가능한 기억기용량 
을 결정한다. 주소모선들은 일 반적 으로 I/O 포구주소지정 에도 리 용된다. 일반적 으로 높 
은 위 치비트들은 모선에서 개 별적 인 기 억기를 선택하며 낮은 위 치의 비트들은 모둘안에 
서 기억주소 혹은 I 八) 포구를 선택한다. 실례로 8 bit 모선에서 주소 01111111 이하는 128 
개의 단어를 가진 기 억기 (모둘 0) 에서의 주소들을 지적 하고 주소 10000000이상은 I 八)장 
치 (모둘 1) 에 포함되 여 있는 I 八)장치 를 지 적하게 할수 있 다. 

조종 모선들은 주소와 자료모선들의 접근과 리용을 조종하는데 리용된다. 자료와 주 
소모선들은 모든 구성 요소들에 서 공동이 므로 그것 들의 리용을 조종하는 방법 이 있 어 야 
한다. 조종신호들은 체계의 장치들사이에 지령과 동기정보를 전송한다. 동기신호들은 
자료와 주소정 보의 유효성 을 가리킨다. 지 령신호들은 수행 되 는 조작을 규정한다. 대 표 
적 인 조종모선들은 다음과 같다. 

• 기억기쓰기: 주소로 지적된 위치에 쓰기 위하여 모선에 자료를 내보내게 한다. 

• 기 억 기 읽 기 : 주소로 지 적 된 위 치 로부터 모선에 자료를 내 보내 게 한다. 

• I/O 쓰기 : 주소로 지적된 I/O 포구에 출구하기 위하여 모선에 자료를 내보내게 
한다. 

• 전송응답: 자료를 모선으로부터 받거나 모선에 내보낸다는것을 가리킨다. 

• 모선요구: 장치가 모선의 조종을 차지 할것을 요구한다는것을 가리 킨다. 

• 모선허가: 모선을 요구하는 장치가 모선을 조종해도 된다는것을 가리 킨다. 

• 새치기요구: 새치기가 요구되였다는것을 가리킨다. 

• 새치기응답: 새치기요구가 접수되였다는것을 알린다. 

• 동기 박자: 조작을 동기화하기 위 하여 리용한다. 

• 재설정 : 모든 장치들을 초기화한다. 

모선의 조작은 다음과 같다. 어떤 장치가 다른 장치에 자료를 전송할것을 요구한다 
면 두가지 작업을 해야 한다. 즉 모선리용을 획득하고 모선에 자료를 전송해야 한다. 
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만일 어떤 장치가 다른 장치로부터 자료를 요구한다면 모선리용을 획득해야 하며 적 당 
한 조종과 주소모선으로 그 장치에 요구를 전송하여야 한다. 그다음 그 장치가 자료를 
보내는 동안 기다려야 한다. 



더 많은 기판(더 많은 기억기 
성요소이 고장났다면 그 기판을 쉽게 교체 할수 있다 


물리적인 체계모선은 여러개의 병렬전기 
도선이다. 이 도선들은 기판 혹은 인쇄기판 
에 부식된 금속선들이 다. 모선은 모든 체계 
구성요소에로 확장된다. 가장 일반적인 물 
리 적 구성들을 그림 3-17 에 주었다. 이 실례 
에서 모선은 두개 의 수직 인 도선들의 렬 로 
이 루어 졌다. 이 수직 렬 을 따라 규칙 적 인 
간격 으로 인쇄 기판을 끼 워 넣 기 위한 수평 
방향으로 확장홈형식으로 된 접속점들이 있 
다. 기본체계구성요소들의 매개는 하나이상 
의 기판들을 가지며 이 홈들에서 모선으로 
접속된다. 전체 배렬은 하나의 구조로 묶어 
진 다. 

이 배 렬 은 가장 합리 적 인것 이 다. 작은 콤 
퓨터체계는 이와 같이 되여야 하며 그다음 
I/O 장치)들을 추가하여야 한다. 만일 기판에서 어떤 구 


2. 다중모선계층 

여러개의 장치들이 모선에 련결되면 성능은 떨어 질것이다. 여기에는 다음과 갈은 
두가지 기본원인이 있다. 

• 일반적으로 많은 장치들이 모선에 접속되면 모선길이가 길어 지고 결국 더 긴 전 
송지 연시 간을 가지게 된다. 이 지연은 장치들이 모선을 리용하도록 조종하는 시 
간을 결정한다. 모선의 조종이 어떤 장치로부터 다른 장치에로 자주 통과할 때 
이 전송지연은 성능에 현저한 영향을 미친다. 

• 모선은 전체적인 자료전송요구들이 모선의 최대한 능력을 접근할 때 충돌현상이 
발생하게 된다. 이 문제는 모선의 자료전송속도를 높이고 또한 더 넓은 모선(실 
례로 자료모선이 32 로부터 64 bit 로 증가)을 리용함으로써 어느 정도 해결할수 
있다. 그러 나 장치들(실례로 영상표시장치와 비데오조종기，망접속부)을 접속하면 
높은 자료전송속도를 요구하게 되는데 이로하여 경쟁이 일어 나게 된다. 이것은 
단일모선으로는 해결할수 없다. 

따라서 대부분 콤퓨터체계들은 다중모선을 많이 리용하여 야 하며 일반적으로 계층을 이 
룬다. 전통적으로 표준적인 구조를 그림 3-18 자에 보여 주었다. 처리장치를 캐쉬기억기에 
련결하고 또한 여러 개의 국부장치 들을 지 원 하는 국부모선 이 있 다. 캐 쉬기 억 기 조종기 는 캐 쉬 
기 억기 를 이 국부모선뿐아니 라 모든 주기 억 장치 에 접속되 여 있는 체 계 모선에 련결한다. 제 4 
장에서 론의하는것처 럼 캐쉬구조의 리용은 흔히 처 리 장치를 주기억기접근요구로부터 분리시 
킨다. 결국 주기억기는 체계모선밖에 있는 국부모선과 분리된다. 이 방법 에서 I/O 와 주기 
억사이의 전송은 능률적 으로 CPU 의 참가없이 체계모선을 통과한다. 
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장치들을 접속할수 있게 하며 동시에 I 八) 자료전송으로부터 기억기와 처리장치사이의 전 
송을 분리시 킨다. 

그림 3-18 자에 확장모선에 접속되는 몇개의 대표적인 "◦장치들의 실례를 보여 주 
었다. 망접속은 10 Mbps 모선형망과 같은 국부망，묶음교환망과 같은 광대 역망을 포함한 
다 . SCSI (Small Computer System Interface ) 는 그자체 가 국부디 스크장치 와 다른 주변 
















장치들에 리용되는 모선의 한 형식이다. 병렬포구는 인쇄기 혹은 화상입력장치를 접속 
하는데 리용된다. 

이 전통적인 모선방식은 일정한 처리능력을 가지지만 I/O 장치들에서 더 높은 성능을 
요구하는 경우에는 불합리하다. 요구들이 증가함에 따라 공업적으로 실현되는 일반방법은 
처리장치모선과 고속모선사이의 다리를 요구하며 체계에 상주하면서 조밀하게 묶어 진 고속 
모선을 구축하는것이다. 이런 배렬은 때때로 중간층 기본방식이라고도 한다. 

그림 3-18 L 에 이 방법을 실현한 대표적 인 실례를 보여 주었다. 즉 주기억기를 지 
원하는 체 계모선에 일 치하게 련결되 는 캐쉬 조종기 에 처 리 장치 를 련결하는 국부모선이 
있다. 이 모선은 100 Mbps 의 속도를 가진 고속 LAN (국부망)들과 비데오와 도형전용워 
크스테 이 션조종기 그리 고 SCSI 와 FireWire (100 Mbps 직 렬모선)를 포함하는 국부주변모 
선들에 대한 접속조종기들에 접속된다. 그뒤층은 고성능 I/O 장치들을 접속하기 위하여 
특별히 설계된 고속모선배 렬이 다. 저속주변장치 들은 여전히 확장모선과 고속모선들사이 
에 전송자료들을 완충하는 대면부가 있는 확장모선에 의하여 접속된다. 

이 배렬의 우점은 우선 고속모선이 처리장치와 함께 설치되여 있는 주기판에 높은 
요구를 제 기 하는 장치 들을 직 접 설 치 할수 있는것 이 며 다음으로 처 리 장치 의 독립 성 을 실 
현할수 있는것이다. 따라서 처리장치와 고속모선에서 의 차이점은 속도들과 신호선정의 
들이 그대로 허용되는것이다. 처리소자의 기본방식의 변화는 고속모선에 영향을 미칠수 
도 있고 미치지 않을수도 있다. 

3. 모선설계의 기본요소 

여러가지 모선실현방법들이 존재하지만 모선들을 분류하고 구별하는것을 도와 주는 
기 본파라메터 혹은 설계 요소들이 있 다. 표 3-2 에 기 본요소들을 보여 주었 다. 

모선형태 

모선의 선들은 두개 의 일 반형태 즉 전 
용화된것과 다중화된것으로 나눌수 있다. 

전용화된 모선은 하나의 기능으로 혹은 콤 
퓨터구성요소들의 하나의 물리적보조묶음 
으로 영구적으로 배치된다. 

기능적전용화의 실례는 많은 모선들에 
서 일반적 으로 구성되는 분할된 전용주소 
모선과 자료모선들의 리용하는 방법 이 다. 

그러나 이것이 기본은 아니다. 실례로 주 
소와 자료정 보가 주소유지조종모선을 리용 
하여 갈은 선묶음으로 전송될수 있다. 자 
료전송의 시작에서 주소는 모선에 배 치되 
며 주소유지선이 능동으로 된다. 이 시점 에서 매 모둘은 주소를 복사하기 위한 지정된 
주기 시 간을 가지 며 주소화된 장치 를 결정한다. 만일 주소화된 장치 가 있 다면 그다음 주 
소는 모선으로부터 분리되 며 갈은 모선접속은 계속하여 읽 기 혹은 쓰기자료전송에 리 용 
된다. 여 러가지 같은 모선을 리용하는 이 방법을 시간다중화방식 이라고 한다. 

시간다중화방식의 우점은 적은 모선을 리용하는것이다. 결함은 매 장치에서 더 복 
잡한 회로들이 요구된다는것 이 다. 또한 갈은 모선들을 공유하는 확실한 사건들이 병렬 


표 3-2. 모선설계의 요소 


형태 

모선 너 비 

전용화 

주소 

다중화 

자료 

중재방법 

자료전송형태 

집중방법 

읽기 

분산방법 

쓰기 


읽기변경쓰기 


읽 기 후&기 


블로크 
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로 배치될수 없기때문에 성능이 감소될 가능성이 있다. 

물러적전용화를 다중모선의 리용방식 이 라고 하며 매개 모선들은 오직 보조장치에만 
접 속된다. 대 표적 인 실례는 모든 I/O 장치 를 서 로 련결 하는 I/O 모선의 리용이 다. 즉 
이 모선은 몇가지 형태의 I 八) 접속장치를 통하여 주모선에 접속된다. 물리적전용화의 우 
점은 모선경쟁이 없으므로 높은 처리능력을 가질수 있다는것이다. 결함은 체계의 규모 
와 가격 이 높아 지는것 이 다. 

중재방식 

가장 단순한 체계를 포함하여 모든 체계에서 여러개의 장치가 모선의 조종을 요구 
할수 있다. 실례로 I/O 장치가 중앙처리장치의 참가없이 직접 기억기에 대한 읽기 또는 
쓰기를 요구할수 있다. 모선을 통하여 한순간에 하나의 장치만이 충분히 자료를 전송할 
수 있으므로 일부 중재방식들이 요구된다. 여러가지 방식들은 일반적으로 집중화 혹은 
분산화방식으로 분류할수 있다. 집중화방식에서 모선조종기 혹은 중재기라고 하는 장치 
는 모선에 대한 시간배정을 담당한다. 이 장치는 분리된 모둘 혹은 처리장치의 부분들 
에 있어 야 한다. 분산화방식에는 중심조종기 가 없다. 오히 려 매개 장치는 접근조종론리 
를 가지며 장치들은 모선을 공유하도록 작용한다. 중재의 두 방식은 모두 목적이 주장 
치로서 처리장치 혹은 I/O 장치중의 어느 한 장치를 가리키는것이다. 그다음 주장치는 
자료교환을 위하여 피동요소로서 동작하는 일부 다른 장치들과 자료전송에 착수한다. 

동기화 

동기화는 사건들이 모선에서 균 
형 을 맞추도록 하는 방법 이 라고 할 
수 있다. 동기식동기화인 경우 모 
선에서 사건들의 발생은 박자에 의 
하여 결정된다. 모선은 박자가 등 
간격시간의 1 과 0 들을 번갈아 규 
칙적인 순서로 전송하는 박자선을 
포함한다. 신히 과 0 의 전송을 박 
자주기 혹은 모선박자라고 하며 주 
기 라고도 한다. 모선에 접속된 모 
든 다른 장치들은 박자선을 읽을수 
있으며 또한 모든 사건들은 박자주 
기 가 시 작하는 위 치 에 서 시 작한다. 

그림 3-19 T 는 동기 식 읽 기 조작(동 
기 선도를 설명한 부록 3-1 참고)을 
위한 시 간선도를 보여 준다. 다른 
모선신호들은 박자신호의 오름면에 
서 변한다. 대부분의 사건들은 한 
개의 박자주기를 점유한다. 이 간 
단한 실례 에서 처 리장치는 읽기신 
호를 보내 고 주소모선에 기 억기주 
소를 배치한다. 또한 모선에 주소와 조종정보의 유효상태를 지적하기 위한 시작신호를 보낸 
다. 기억기모둘은 주소에 응답하여 한주기후에 모선에 자료와 응답신호를 보낸다. 




그림 3-19. 읽기조작시간선도 
n- 동기식동기화，비동기식동기화 


65 



비동기식동기화인 경우 모선에서 한사건의 발생은 앞선 사건의 발생에 뒤따르며 의 
존된다. 그림 3-19 i •의 간단한 실례에서 처리장치는 모선에 주소와 읽기신호를 보낸다. 
이 신호들이 안정 상태 로 유지 된후에 확고한 주소와 조종신호들의 유효상태 를 가리키 는 
MSYN (주동기)신호를 내보낸다. 기억기모둘은 자료와 함께 응답을 가리키는 SSYN (피 
동기)신호로 응답한다. 일단 주장치가 자료모선으로부터 자료를 읽으면 MSYN 신호를 
중지시킨다. 이것은 기억기장치가 자료와 SSYN 선들을 차단하게 한다. 끝으로 SSYN 선 
이 일 단 차단되 면 주장치 는 읽 기신호와 주소정 보를 다시 전송한다. 

동기식동기 화를 실 현하고 검 사하는것 은 간단하다. 그러 나 비동기식동기 화보다 유연 
성 이 부족하다. 동기식 모선에서 모든 장치 들은 고정박자속도의 제 한을 밤으므로 체 계는 
장치성능이 개선되여도 그 우점이 나타나지 않는다. 비동기화에서는 낡은 기술로 만들 
어 진 속도가 뜬 장치 와 새 로운 기 술에 의해 만들어 진 속도가 빠른 장치 들을 섞어서 
체계를 만들어도 그들 모두가 모선을 공유할수 있다. 

모선폭 

이미 모선폭에 대한 개념을 고찰하였다. 자료모선의 폭은 체계의 성능에 영향을 준 
다. 더 넓은 모선은 더 많은 비트들을 한번에 전송한다. 넓은 주소모선은 체계의 기억 
용량에 영향을 준다. 주소모선이 넓으면 더 넓은 범위의 주소를 참조할수 있다. 


(첫 T 有기 ) | (두번주기 )| 




다중선택 기 가 있는 경 우 쓰기 조작 - 
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자료 
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다중선택기가 없는 경우 읽기조작 
그림 3-20. 모선자료전송형식 


자료전송형식 

끝으로 모선은 그림 3-20 에서 보여 주는것처 럼 여 러 가지 자료전송형식을 제공한다. 
모든 모선들은 쓰기와 읽기전송을 가진다. 다중화된 주소/자료모선의 경우에 모선은 먼 
저 주소를 지정하고 그다음 자료를 전송하는데 리용된다. 읽기조작에서 모선에 접속되 
여 있는 피동장치로부터 자료를 꺼내는 동안 일반적으로 기다림을 가진다. 읽기 혹은 
쓰기 에 서 나머 지조작을 위한 모선조종권(읽 기 /쓰기 를 요구하기 위한 모선점 유와 그후 
읽기/쓰기를 진행하기 위한 모선점유)을 얻기 위하여 중재과정을 거쳐야 한다면 역시 
지 연이 필요하다(실 례 로 읽 기 쓰기 를 요구하는 모선을 장악한 다음，읽 기 쓰기 를 수행하 
기 위하여 다시 모선을 장악한다. ) . 
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주소와 자료모선을 전용화하는 경우에 주소는 주소모선에 놓이며 자료는 자료모선 
에 놓인다. 쓰기조작에서 주장치는 자료모선에 자료를 출력하고 즉시로 주소를 고정시 



그림 3-21. PCI 구성 의 실 례 

_ i - 일반적 인 탁상형콤퓨터체계， u - 일반적 인 봉사기체계 


킨 다. 그리 고 보조장치 는 그 주소에 대 응하여 능동상태 로 된 다. 읽 기조작에 서 종속장치 
는 주소에 대응하여 자료모선에 자료를 내보내며 주장치는 자료를 읽어 들인다. 

또한 몇개의 모선들을 허 가하는 여 러 가지 접속조작들이 있다. 읽 기변경쓰기 (쓰기후 
읽기)조작은 같은 주소에 대하여 쓰기를 한 다음 즉시에 읽기를 하는 간단한 조작이다. 
주소는 이 조작과정 에 오직 한번만 나타난다. 다른 모선조종자에 의한 자료접 근을 방지 
하기 위하여 모든 조작은 모두 개 별적 으로 할수 있다. 이 기 능의 기 본목적 은 다중프로 


67 





그람체 계 에서 공유기억 자원을 보호하기 위한것 이 다(제 7장 참고) . 

쓰기후 읽 기는 갈은 주소로부터 읽기 가 직접 뒤따르는 쓰기 로 이루어 진 분리할수 
없는 조작이다. 이 읽기조작은 검사목적으로 수행된다. 

일부 모선체계들은 블로크자료전송을 제공한다. 이 경우에 한개 주소박자에 n 개의 
자료박자가 뒤 따른다. 첫 자료항목은 지 정된 주소에 의하여 전송된다. 나머 지자료들은 
순서 배 렬 주소에 의하여 전송된 다. 


제5절. PCI 

PCI(Peripheral Component Interconnect ) 는 일반적 인 고성능접속부이며 주변모선 혹은 
중간층모선으로서 의 기 능을 수행할수 있는 처 리 장치 와 독립모선 이다. 다른 일 반모선에 
비 하여 PCI 는 고속 I 八) 보조체 계 들 (실 례 로 도형표시장치접 속기，망접 속조종기，디 스크조 
종기 등)을 위한 더 좋은 체 계 성 능을 제 공한다. 현재 표준은 528 Mbyte/s 혹은 
4.224 Gbps (초당 비 트)의 전송속도를 가질 수 있는 66 MHz 의 64 bit 자료모선의 리 용을 허 
가한다. 그러나 PCI 의 매력을 느끼게 하는것은 속도뿐이 아니다. PCI 는 현대체계들의 
I/O 요구들을 경제적으로 만족시킬수 있게 특별히 설계되였다. 즉 실현하는데 아주 적 
은 소편들이 요구되 며 PCI 모선에 접 속된 다른 모선들을 지 원한다. 

인텔은 펜리움기준체계에 1990 년부터 PCI 를 설치하였다. 즉시 인텔은 공동소유를 
위하여 특허 를 공개 하였 으며 PCI 세 부의 호환성 을 유지 하면서 앞으로 더 발전시 키 기 위 
하여 산업련합의 창조물인 PCISIG 로 발전시 켰 다. 결과 PCI 는 개 인용콤퓨터，워 크스레 
이 션，봉사기 체계 들에서 광범히 도입 되 였으며 더 널 리 리용되 였 다. 여 기 에서 서 술하고 
있는것은 그 변종이 1995 년에 공개된 PCI 2.1 이 다. 세부가 공개되고 극소형처 리장치와 
주변장치 산업 에 서 기 판상의 부분으로 제 공되 고 있 으므로 여 러 판매 자들에 의하여 제 작 
된 PCI 는 호환성 을 가진 다. 

PCI 는 단일 처 리 장치 체 계 와 다중처 리 장치 체 계 들을 포함하는 극소형처 리 장치 기 준구성 
의 다양성 을 지 원하기 위하여 설계되 였 다. 따라서 일 반목적 기능모임들을 제 공한다. PCI 
는 동기 식 동기 화와 집 중화된 중재 기 설 계 방안의 리 용을 받아 들인것 이 다. 

그림 3-21 1는 단일처 리 장치체계 에서 PCI 의 리용을 대 표적 으로 보여 준다. PCI 모 
선에 접 속된 DRAM 조종기 와 다리 는 처 리 장치 와 련결을 믿음성있게 보장하며 높은 속도 
의 자료전송을 보장하기 위한 능력 을 가진 다. 다리 는 PCI 모선의 속도가 처 리 장치 의 
I/O 속도와 차이나므로 완충기 로서 동작한다. 다중처 리 장치체 계 (그림 3-21 L ) 에서 여 
러개의 PCI 구성들은 처리장치체계모선에 다리를 통하여 련결된다. 체계모선은 오직 처 
리장치/캐쉬장치，주기억기 와 PCI 다리들에 만 련결된다. 다시말하여 다리의 리 용은 처 리 
장치속도와 독립적 인 PCI 를 보존하며 여전히 자료수신과 송신을 빠르게 할수 있는 능력 
을 제공한다. 

1. 모선구조 

PCI 는 32 혹은 64 bit 모선으로 구성 되 였 다. 표 3-3 에 서 PCI 에 있는 49 개 의 조종신 
호선들을 정 의하였 다. 이 것 들은 다음과 같은 기 능그룹들로 나누어 진다. 
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표 3-3. PCI 지 령신호선 


신호명 1 형태 1 설명 

체계 단자 

CLK 

in 

모든 동작에 대한 동기를 제공하며 오름면에서 모든 입력신호들을 접수하게 한다. 
33 MHz 에 박자속도를 지 원한다 

RST # 

in 

초기 화상태 를 위 하여 모든 PCI 특수등록기 들，순서 기，, 선호들을 초기 화한다. 

주소와 자료단자 | 

AD [3：：0] : 

t/s 

주소와 자료에 리용되는 다중화된 모선 

C / BE [3::||: 

t/s 

지령과 바이트가능신호를 위한 다중화된 모선. 자료단계에서 이 모선들은 
4 byte 통로들중에 어느것으로 지적된 단어를 보내겠는가를 가르킨다. 

PAR 

t/s 

한박자후에 AD 와 C/BE 모선들의 기 우성 을 제 공한다. 주장치 들은 주소모 
선과 쓰기자료단계 를 위한 PAR 를 구동한다. 대 상장치 는 읽 기 자료단계 
를위한 PAR 를 구동한다. 

대면부조종단자 | 

FRAME # 

s / t/s 

동작의 시 작과 진행 을 지 적 하는 현재주장치 에 의하여 구동된다. 이 신호는 시 
작에 서 능동으로 되 며 초기 화장치 가 마지 막자료단계 의 시 작을 준비 할 때 피 
동으로 된다. 

IRDY # 

s / t/s 

초기 화장치 가 이 신호를 내 보낸다. 즉 현재 모선주장치 (동작의 초기 화장치 ) 에 
의하여 구동된다. 읽기할 때 주장치가 자료를 접수할 준비가 되였다는것을 지 
적 하며 쓰기 할 때 유효자료가 AD 에 존재 한다는것 을 지 적 한다. 

TRDY # 

s / t/s 

대상자가 이 신호를 내보낸다. 즉 대상자(선택된 장치)에 의하여 구동된 
다. 읽기할 때 유효자료가 AD 에 존재한다는것을 지적하며 쓰기할 때 대 
상자가 자료를 접 수할 준비 가 되 였 다는것 을 지 적한다. 

STOP # 

s / t/s 

현재대상자가 초기 화장치 로 하여금 현재동작을 정 지시키도록 요구하는것 을 가 
리킨다. 

IDSEL 

in 

초기 화장치선택 . 소편이 구성 읽기와 쓰기동작을 진행하는것 을 선택 하는데 리 
용된 다. 

DEVSEL # 

in 

장치선택. 장치의 주소가 인식되였을 때 목적장치를 능동으로 설정한다. 
어느 장치가 선택되였는가를 현행초기화장치에게 알려 준다. 

중재단자 | 

REQ # 

t/s 

장치가 모선을 리용할것을 요구한다는것을 중재기에 알린다. 장치들은 별 
형방식으로 접속한다. 

GNT # 

t/s 

중재기가 모선접근을 승인한다는것을 장치 에 알린다. 장치들은 별형방식 
으로 접속된다. 

오유물보단자 | 

PERR # 

s / t/s 

기 우성 오유. 자료기 우성 오유가 쓰기단계 에 서 대 상자에 의 하여 읽 기단계 에 
서는 초기화장치 에 의하여 검사되 였다는것을 시 작한다. 

SERR # 

o/d 

체계오유. 임의의 장치가 기우성오유와 이와 다른 파괴적인 오유들을 통 
신하려고 할 때 발생한다. 


• 체 계 단자들: 박자와 재 설 정 단자들을 가진 다 . 

• 주소와 자료단자들: 주소와 자료들을 시 간적으로 분배 하는 32 개의 선들이 다. 이 그를 
의 일부 신호선들은 주소와 자료를 나르는 신호선들을 해석하고 유지하는데 리용된다. 
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• 대면부조종단자들: 처리의 동기를 조종하고 초기화장치와 대상자사이의 일치를 
보장한다. 

• 중재단자들: 일부 PCI 신호선들과는 달리 이 신호선들은 공유되지 못한다. 오히려 
매 PCI 주장치 들은 PCI 모선중재 기 에 직 접 련결되 는 중재 선들과 쌍을 이 룬다. 

• 오유통보단자들: 기우성오유와 다른 오유들을 통보하는데 리용된다. 

또한 PCI 상세명세 표는 아래 와 같은 기 능그룹들로 구분된 51 개 의 선택신호선(표 
3-4) 들을 정의한다. 


표 3-4. PCI 선택적인 신호선 


신호명 형태 설명 

새치기단자 

INTA # 

o/d 

새치기를 요구하는데 리용된다. 

INTB # 

o/d 

새 치기를 요구하는데 리 용된다. 다기능장치 에만 해 당된다. 

INTC # 

o/d 

새 치기를 요구하는데 리 용된다. 다기능장치 에만 해 당된다. 

INTD # 

o/d 

새 치기를 요구하는데 리 용된다. 다기능장치 에만 해 당된다. 

I 캐쉬지연단자 ! 

SB 

in/out 

탐색탈퇴. 변경된 행에 대한 명중을 지적한다. 

SDONE 

in/out 

탐색완료. 현재중점에 대한 탐색의 상태를 가리킨다. 탐색이 완료되였을 
때 능동으로 된다. 

I 64 bit 모선확장단자 | 

AD [63::3 幻 

t/s 

64 bit 모선으로 확장하도록 주소와 자료에 대 하여 리 용되는 다중화모선 

C / BE [7：：4]# 

t/s 

모선지령과 바이트허가신호도 다중화된다. 주소단계에서 이 신호선들홋 : 
추가적인 모선지령을 제공한다. 자료단계에서는 4 byte 통로들중의 어느 
통로로 자료를 전송하는가를 지적한다. 

REQ 64 

s / t/s 

64 bit 전송을 요구하는데 리 용한다. 

ACK 64# 

s / t/s 

대 상절 차. 64 bit 전송을 수행 하도록 할것을 지 시 하고 있음을 가러 킨다. 

PAR 64 

t/s 

한박자 다음에 한박자 AD 와 C/BE 선들에 대 한 우수기 우성 을 제 공한다. 

| JTAG / 한계주사단자 ! 

TCK 

in 

박자검 사. 박자상태정 보와 경 계 주사하는 동안 장치 에 대 한 자료의 입 출력 
검 사에 리 용된다. 

TDI 

in 

입력검사. 장치에 검사자료와 명령을 련속적으로 밀어 넣는데 리용된다. 

TDO 

out 

출력 검사. 장치밖으로 검사자료와 명령들을 련속적으로 밀어 내는데 리용된다. 

TMS 

in 

방식 선택 검 사. 검 사접 근포구조종기 의 상태 를 조종하는데 있 다. 

TRST # 

in 

재 설정 검 사. 검 사접 근포구조종기 를 초기 화하는데 리 용된 다. 


In 一 입력신호 
Out 一 출력신호 

t/s - 쌍방향，3 상태 , 입 출력신호 

s / t/s — 한번에 하나의 소자에 의 해서 만 구동되 는 3상래 신호를 확인 

o/d 一 열린배출구: 여러 장치들이 배선론리합을 리용하여 공유하자는데 있다. 

# 一 신호의 능동상태 가 L 준위임 을 표시 
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• 새 치기단자들: 이 단자들은 봉사요구를 발생 해 야 하는 PCI 장치들을 위하여 제 공 
한다. 이 것 들은 중재단자들에 의하여 공유된 선들이 아니 다. 오히 려 매 PCI 장치 
들은 새치기조종기들에 자기의 새치기선 혹은 선들을 가진다. 

• 캐쉬지원단자들: 이 단자들은 처리장치 혹은 다른 장치에 림시 완충될수 있는 
PCI 의 기억기를 지원하는데 필요하다. 이 단자들은 전용캐슈통신규약들을 지원한 
다(이 와 갈은 규약의 론의 는 제 16 장 참고) . 

• 64bit 모선확장단자들: 주소와 자료들에 시 간적 으로 다중분배 되 며 64 bit 주소/자료모 
선형식으로 확장주소/자료모선들로 접속되는 32 bit 모선을 포함한다. 이 그룹에서 일 
부 선들은 주소와 자료모선들을 나르는 신호선들을 해석하고 유지하는데 리용된다. 
끝으로 두개 의 PCI 장치 가 64 bit 로 리 용될수 있게 하는 두개 의 선이 있 다. 

• JTAG / 경계선 주사단자들: 이 신호선들은 IEEE 규격 1149.1 에서 정의된 절차검 
사를 지원한다. 

2. pci 지령 

모선 활용은 봉사요구자 혹은 모선조종장치 와 목적 대 상자사이 의 작용형 태 로 발생 한 
다. 모선조종장치가 모선의 조종을 가졌을 때 다음에 발생할수 있는 동작의 형태를 결 
정한다. 작용에 서 주소가 모선을 차지하는 동안 C/B 모선들이 동작형 태 를 통보하는데 
리용된다. 지령들에는 다음과 갈은것들이 있다. 

• 새치기응답 

• 특수주기 

• I/O 읽 기 

• I 八)쓰기 


자 억 

기 읽기 

자 억 

기 읽기선 

자 억 

기 읽 기 다중화 

자 억 

기 쓰기 

자 억 

기쓰기와 무시 


• 구성읽 기 

• 구성쓰기 

• 2중주소주기 


새치기응답은 PCI 모선에서 새치기조종기로서의 기능을 가진 장치에 대한 고위적인 
읽 기지 령 이 다. 주소모선들은 주소단계동안 리용되 지 못하며 바이 트허 가선들은 되 돌려 
지 는 새 치 기지 적 자의 크기 를 지 적한다. 

특수주기지 령은 초기화장치 로 하여금 여 러개의 대상자들에 통보를 전면전송하도록 
하는데 리용된다. 

I/O 읽 기 쓰기지 령 은 초기 화장치 와 I/O 조종기 사이 의 자료를 전송하는데 리 용된다. 매 개 
I/O 장치는 자기의 I/O 주소공간을 가지며 주소모선들은 개별적 인 장치들을 지적하고 그 장 
치와 전송하는 자료를 지적하는데 리용된다. I/O 주소의 개념은 제 6 장에서 설명하였다. 

기 억기읽기와 쓰기지 령은 자료전송을 지적하는데 리용되며 자료전송은 하나이상의 
박자를 가진다. 이 지령들에 대한 해석은 PCI 모선에 있는 기억기조종기가 기억기와 캐 
쉬 사이 의 전송을 위 한 PCI 통신규약을 지 원하는가 하지 않는가에 의 존한다. 만일 있다면 
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기 억 기 와의 자료전송은 일 반적 으로 캐쉬행 들 혹은 블로크들로 진행된다. 3 개의 기 억 기 
읽기지령은 표 3-5 에서와 같이 대략적으로 리용된다. 기억기쓰기지령은 기억기에 하나 


표 3-5. PCI 읽 기 지 령 의 해 석 


읽기 명령 형래 

캐쉬가능기억기 

캐쉬불가능기억기 

기억기 읽기 

한행의 절반이하채우기 

，개의 자료전송주기이하 
채 우기 

기억기읽기행 

3 개의 캐쉬행까지 한행 
의 절반이상채우기 

3〜,12개 자료전송채 우기 

기억기다중읽기 

3개의 케쉬행이상채우기 

12개 자료이 상채 우기 


이 상의 자료주기 로 자료전송을 위하여 리 용된다. 기 억기쓰기 와 무시지 령 은 기 억 기 에 하 
나이상의 박자들로 자료를 전송한다. 추가적으로 적어도 하나의 캐쉬행을 쓰는것으로 
한다. 이 지령은 기억기에 한행을 비동시쓰기하는 캐쉬기능을 지원한다. 

주장치 는 두개 의 설 치 지 령 을 통하여 PCI 에 련결된 장치 의 설 치 파라메 터 를 읽 거 나 
갱 신할수 있다. 매 PCI 소자는 256 개까지의 내부등록기를 가지 고 있는데 이 등록기들이 
체계를 초기화하는 동안 그 소자를 구축하는데 리용된다. 

2 중설치주소주기지령은 초기화장치에게 이 지령이 64 bit 주소화를 리용하고 있다는 
것을 알려 주는데 리용된다. 


3. 자료전송 

pci 모선에서 모든 자료전송은 하나의 주소단계와 하나이상의 자료단계로 이루어 지는 
단일동작이다. 이 론의에서는 표준적인 읽기조작을 설명한다. 쓰기조작은 이와 비숫하다. 

그림 3-22 는 읽 기조작의 시 간선도를 보여 준다. 모든 사건은 매 박자주기의 중간에 
있는 박자의 내 림 면시 동으로 동기화된 다. 그러 나 장치 들은 모선주기 의 시 작오름면에 서 
모선들을 접수한다. 그림에 표시된 다음과 같은 사건들을 고찰하자. 

1. 일 단 모선주장치가 모선의 조종을 획득하면 FRAME 을 능동상태 로 만듦으로 
써 기 동을 시 작한다. 이 선은 초기 화장치 가 마지 막자료단계 를 완성하는것 을 
준비할 때까지 능동상태를 유지한다. 초기화장치는 또한 주소모선에 시작주 
소를 전송하며 C/BE 선들에 는 읽 기 지 령 이 전송된 다. 

두번째 박자의 시작에서 대상자는 AD 선들에서 그의 주소에 응답하여야 한다. 

c . 초기화장치는 AD 모선구동을 끝낸다. 련속되는 주기는 하나이상의 장치 에 의 
하여 구동되 는 모든 신호선들에 요구된 다. 따라서 주소신호의 동작을 끝냄으 
로써 목적장치 들이 모선을 리용하도록 하게 한다. 초기 화장치 는 현재 주소화 
된 자료 ( l ~4 byte ) 를 전송하는데 AD 모선 이 리 용되 도록 하기 위 하여 C/BE 선 
들의 정보를 변화시킨다. 초기화장치는 또한 첫 자료항목에 대한 준비가 되 
였 다는것 을 지 시하는 TRDY 신호를 능동으로 설 정한다. 

H . 선택 된 목적대 상자는 그 주소를 인식 하고 응답하였 다는것 은 지 적하는 
DEVSEL 신호선을 능동으로 설정한다. 대 상자는 AD 선들에 요구된 자료를 
배 치 하고 모선에 유효자료가 존재 한다는것 을 지 적하는 TRDY 신호선을 능동 
으로 한다. 

n . 초기화장치는 박자4의 시작점에서 자료를 읽으며 다음읽기에 대한 준비를 요 
구할 때 바이트허가선들을 변화시 킨다. 
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u. 이 실례 에서 대상자는 자료전송의 두번째 블로크를 준비 하는데 일정 한 시 간 
을 요구한다.그러므로 대상자는 다음주기동안 새로운 자료를 가질수 없는다 
는것 을 초기 화장치 에 신호하기 위하여 TRDY 신호선을 피 동으로 설정한다. 
따라서 초기화장치는 5 번째 주기의 시작에서 자료모선을 읽을수 없으며 그 
주기 동안 바이 트허 가를 변화시 키 지 못한다. 자료항목을 읽 기 위한 준비 를 여 
전히 하지 못한다. 그러므로 IRDY 신호선이 피동으로 설정된다. 이것은 대상 
자가 일정한 박자주기 동안 모선상에 세번째 자료항을 유지 하도록 한다. 

A. 초기화장치는 세번째 자료전송이 마지막이 라는것을 알고 따라서 이것 이 마지 
막자료전송이라는것 을 대 상자에 게 신호하기 위하여 FRAME 신호선을 피동으 
로 만든다. 또한 초기화장치는 이 전송의 완료를 준비한다는것을 신호하기 
위하여 IRDY 신호선을 능동으로 설정한다. 
o. 모선을 휴식상태로 되돌리도록 초기화장치는 irdy 신호선을 피동으로 하며 
대 상자는 TRDY 와 DEVSEL 신호선을 피 동으로 설정 한다. 

4. 중재 

PCI 는 매 개 주장치 들이 유일 한 요구 (R 와 허 가신호) 를 가지 는 집 중화된 동기 식 중재 
방법 을 리용한다. 신호선들은 중심중재기 에서 형성 되며 단순한 요구허 가맞잡이조종은 
모선에 대한 접근을 확인 하는데 리 용된다 (그림 3-23). 



그림 3-23. PCI 모선중재기 


PCI 세 부는 개 별적 인 중재 알고리 듬을 지 적 하지 못한다. 중재 기 는 선입 선출봉사방법， 
회 전순회방법 혹은 어 느 정 도의 우선순위방법 을 리 용할수 있 다. 

PCI 주장치는 하나의 처리가 하나이상의 련속적인 자료단계들과 그에 대응하는 하나 
의 주소단계로 구성된 동작을 수행하도록 매개 처리에 대하여 중재를 해야 한다. 

그림 3-24 는 장치 A 와 B 가 모선에 대 하여 중재 하고 있는 실례 이 다. 

다음과 같은 순서로 진행된다. 

1. 박자 1 시작의 어떤 앞의 위치에서 A 는 REQ 신호를 내보낸다. 중재기는 
박자주기 1의 시작에서 이 신호를 접수한다. 
u. 박자주기 1 동안 묘는 REQ 신호를 보내여 모선의 리용을 요구한다. 
n. 동시에 중재기는 A 에 대한 모선접근을 허가하도록 GNT-A 를 능동으로 
만든다. 

H. 모선조종기 A 는 박자 2 의 시작에서 GNT-A 를 접수하며 모선접근을 하게 
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한다. 모선이 휴식상태 라는것 을 지적하는 IRDY 신호선과 TRDY 신호선이 
비능동으로 되였는가를 확인한다. 따라서 FRAME 신호선을 능동으로 만들 
고 주소모선에 주소정보와 C/BE 모선에 지령을 배치한다. 또한 이 동작후 
에 수행 되 는 두번째 동작을 하도록 REQ-A 를 계 속 능동으로 한다. 
n . 모선중재기 는 박자 3 의 시 작에 서 모든 GNT 모선들을 접 수하며 다음동작을 
위하여 묘 에 모선을 허 가하도록 중재 결정 을 진행 한다. 그다음 GNT-B 를 능 
동으로 하며 GNT-A 를 비 능동으로 만든다. 묘 는 모선의 휴식 상태 로 되돌아 
올 때까지 모선을 리용할수 없다. 



H. A 는 마지막자료전송이 진행중이라는것을 지적 하도록 FRAME 신호선을 비능 
동으로 만든다. A 는 자료모선에 자료를 전송하며 IRDY 신호선으로 대상자에 
게 신호한다. 대상자는 다음박자주기의 시작에서 자료를 읽는다. 

A . 박자 5 의 시 작에서 묘 는 IRDY 신호선과 FRAME 신호선이 비능동으로 되 였 
다는것 을 확인하고 FRAME 신호선을 능동상태 로 만들어 모선의 조종을 가질 
수 있게 한다. 또한 하나의 동작만을 수행할것 을 원하므로 REQ 신호선을 비 
능동으로 만든다. 

계 속하여 조종기 A 는 다음동작을 위 한 모선의 접 근을 승인한다. 

중재 는 현재모선조종기 가 자료전송을 수행 하고 있는것 과 동시 에 진행할수 있 다는것 
을 알수 있다. 그러므로 모선주기가 중재수행에서 끊어 지지 않는다. 
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참고문헌과 Web 싸이트 


모선들과 다른 호상접속구조들에 대한 문헌은 그리 많지 못하다. [ALEX93] 에서는 
여 러 가지 특수한 모선들의 평 가를 포함하여 모선구조와 모선전송지표들에 대 하여 심 도 
있게 취급하였다. 

PCI 에 대 하여 충분하고 명 백하게 서 술한 책은 [SHAN95], [SOLA94] 들이며 여 기서는 
PCI 에 대 한 확고한 많은 정 보들을 취 급하였 다. 



Web 싸이트 

• PCI special Interest Group ： 이 Web 싸이트는 PCI 규정과 상 
품에 대한 정보를 제공한다. 


련습문제 

1. 그림 3-4 의 가상적 인 처 리 장치 가 다음의 두개의 I 八)명 령을 가진다. 

0011 = I/O 로부터 AC 에 넣 기 
0111 = I/O 에 로 AC 를 출구 

이 경 우에 12bit 주소는 개 별적 인 I/O 장치 를 지 적한다. 다음의 프로그람에 
대한 프로그람집행을 고찰하시오. 

• 장치 5 로부터 AC 에 넣 기 

• 기 억기위치 940 의 내 용과 더 하기 

• 장치 6 에로 AC 를 출구 

장치 5 로부터 받은 값은 3 이고 주소 940 은 2 라는 값을 가진다고 가정하시오. 

2. 두개의 마당으로 이루어 진 32bit 명령을 가지는 가상적인 32bit 극소형처리장치 
에 대 하여 고찰하자. 여 기서 명 령의 첫번째 바이 트는 조작코드이고 나머지 는 
직접값연산수 혹은 연산수주소이 다. 

1. 최대로 직접주소화할수 있는 기억기용량(바이트)은 얼마인가? 

만일 극소형처리장치모선이 

① 32bit 국부주소모선과 16bit 국부자료모선 혹은 

② 16bit 국부주소모선과 16bit 국부자료모선일 때 체계속도에 대한 영 
향을 론의 하시 오. 

c . 프로그람계 수기 와 명 령 등록기 가 얼 마만한 비 트길 이 를 요구하는가? 

[ALEX93] 참고 

3. 16bit 주소 (실 례 로 프로그람계 수기 와 주소등록기 가 16bit 폭이라고 가정 ) 와 
16bit 자료모선을 가지는 가상적인 극소형처리장치를 고찰하자. 

1 .처리장치가 I6bit 기억기에 련결될 때 직접 접근할수 있는 최대기억주소 
공간은 얼마인가? 
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처리장치가 8bit 기억기에 련결될 때 직접 접근할수 있는 최대기억주소 
공간은 얼마인가? 

c. 개별적 인 I/O 공간을 접 근하는데 이 처 리 장치는 어떤 방식 적 기 능을 가질 
수 있는가? 

H.I 八) 명령 이 8bit I八) 포구번호를 지적한다면 극소형처 리장치는 얼마나 많 
은 8bit I/O 포구를 제공할수 있는가，얼마나 많은 16bit I/O 포구를 제 
공할수 있는가를 설명하시오. 

[ALEX 93] 참고 

4. 16bit 의 외부자료모선과 8MHz 로 동작하는 32bit 극소형 처 리 장치 를 고찰하자. 
이 극소형처리장치는 최소지속시간이 4 개 박자주기인 모선주기를 가진다고 가 
정 하자. 이 극소형 처 리 장치 가 유지 할수 있는 최 대 자료전송속도는 얼 마인가? 성 
능을 높이기 위하여 외부자료모선을 32bit 로 만들며 극소형처 리장치에 공급되는 
외부박자주파수를 2 배로 할수 있는가? 자기가 만든 임의의 다른 가설들을 말하 
고 설명하시오. 

[ALEX93] 참고 


5. 간단한 건반/인쇄기를 가진 전신타자기를 조종하는 I/O 장치를 포함하는 콤퓨터 
체계를 고찰하자. 다음의 등록기들은 처리장치안에 있으며 체계모선에 직접 련 
결된 다. 


INPR ： 

입구등록기， 8bit 

OUTR ： 

출구등록기， 8bit 

FGI ： 

입력기발, lbit 

FGO ： 

출력기발， lbit 

IEN ： 

새치기가능비트， lbit 


전신 타자기 로부터 의 건 반입 력 과 전 신타자기 에 로의 인쇄 출력 은 I/O 장치 에 의 하 
여 조종된다. 전신타자기는 8bit 단어 로 영 어자모와 수자기호들을 부호화하고 
8bit 단어를 영 어 자모와 수자로 해 신할수 있다. 

1.이 문제에서 서술된 첫 4 개의 등록기들을 리용하여 어떻게 처리장치가 
전신타자기와 I八)동작을 할수 있는가를 서술하시오. 
i •.또한 IEN 을 리용함으로써 기능이 어떻게 더 효과적으로 수행될수 있는 
가를 서술하시오. 

6. 그림 3-25 에서는 다중모선I에서 리 용할수 있는 분산형중재방식 을 보여 주었 다. 
모선요구자들은 우선순위 에 따라 물리 적 인 련쇄사슬모양으로 접 속되 였 다. 가장 
왼쪽 요구자는 모선을 요구하는 더 우선권이 높은 요구자가 없다는것 을 지적하 
는 신호 (SPRN) 에 의하여 제 일 높은 모선우선권을 부여 받는다. 만일 요구자가 
모선요구를 바라지 않는다면 자기 의 모선우선권보내 기신호를 설정한다. 박자주 
기의 시작에서 임의의 요구자는 자기의 모선우선권보내기 (BPRN) 신호를 능동으 
로 설정한다. 박자주기 의 시 작에서 임의 의 요구자는 자기 의 BPRO 를 낮은 준 


77 



위 로 설정하여 모선조종권을 요구할수 있다. 이것은 자기의 BPRO 신호가 낮은 
준위 로 된것 과 일 치하도록 사슬내 의 다음요구자의 BPRN 을 낮은 준위 로 설 정 
한다. 따라서 이 신호는 사슬을 따라 전파된다. 이 사슬작용의 끝에 BPRN 이 
설정 되 고 BPRO 가 자기 사명 을 못하는 하나의 모선요구자가 존재한다. 이 요 
구자는 우선권을 가진다. 만일 모선주기의 시작에서 모선이 동작하지 못하면 
(비능동상태이면) 우선권을 가진 요구자는 BUSY 신호선을 설정함으로써 모선 
의 조종을 점유할수 있다. 

BPR 신호를 가장 높은 우선권을 가진 요구자로부터 우선권이 가장 낮은 요구자 
까지 전송하기 위한 확실 한 시 간을 가진 다. 이 시 간은 주기박자보다 작아야 하 
는가? 실례를 들어 보시오. 



그림 3-25. 다중모선 ID 의 분산형중재원리 

7. VAXSBI 모선은 분산형 동기 식 중재 방법 을 리 용한다. 매 개 SBI 장치 (실 례 로 처 리 
장치，기억기，단일모선접속기)들은 하나의 우선권을 가지며 하나의 전송요구 
( TR ) 선을 가진다. SBI 는 이와 갈은 16 개의 신호선 ( TR (广 TR 15 ) 을 가지며 여기 
서 TR 0 이 우선권이 제 일 높다. 어떤 장치가 모선리용을 요구할 때 현재시간슬 
로트에서 자기의 TR 선들을 조사한다. 즉 예 약된 가장 우선권이 높은 장치는 
다음시 간슬로트를 리 용한다. 

최대로 17개의 장치들이 모선에 접속될수 있다. 우선권이 16인 장치는 TR 선이 
없다. 왜 그런가? 

8. 사실 가장 낮은 우선권을 가진 장치가 보통 가장 작은 평균기 다림시간을 가진 
다. 이 리 유로 처 리 장치는 보통 SBI 에서 가장 낮은 우선권으로 주어 진다. 왜 
우선권이 16 인 장치는 가장 작은 평균기 다림시간을 가지는가? 어떤 환경에서 
사실이 맞지 않을수 있는가? 

9. PCI 쓰기 조작에 대 한 시 간선도를 그리 고 설 명 하시 오. 

부록 3. 시간선도 

이 장에서 시간선도는 사건들의 순서와 사건들사이의 의존관계를 설명하는데 리용 
되였다. 시간선도를 잘 모르는 독자들을 위하여 이 부록에서는 간단한 설명을 준다. 

모선에 련결된 장치들사이의 통신은 신호들을 나르는 능력을 가진 선들의 묶음에 
의 하여 이루어 진다. 2 진수 0과 1 로 표현되는 두개의 서로 다른 신호준위들이 전송된다. 
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시 간선도는 시 간의 함수로서 선에 신호준위 를 보여 준다. 규약에 의하여 2진수 1신호준 
위는 2 진수 0 보다 높은 준위로서 묘사한다. 일반적으로 2 진수 0 은 암시적인 값이다. 
즉 자료 혹은 다른 신호가 전송되 지 않고 있 다면 이 때 선의 준위 는 2진수 0 을 표현하는 
것 이 다. 0 으로부터 1 에 로의 신호절환은 흔히 오름면으로서 표현한다면 1 로부터 0 으로의 
절환은 내 림면으로 표현된다. 명백히 신호절환은 흔히 급격히 발생하는것으로 표현된다. 
실제 로 절환시간은 령 이 아닌 어 떤 값을 가진다. 그러 나 이 절환시간은 신호준위 의 지 
속시간에 비하여 일반적으로 작다. 시간선도에서 지속되거나 불필요한 시간이 나타나는 
사건들사이에 존재한다는것을 찾아 볼수 있다. 이것은 시간렬에서 공백으로 표현된다. 

신호들은 때때로 그룹들로 표현된다. 실례로 자료가 한번에 한바이트 전송된다면 8 
개의 선이 요구된다. 일반적으로 이와 같은 그룹으로 전송되는 정확한 값을 아는것은 
중요하지 않으며 오히려 신호들이 존재하는가 안하는가가 중요하다. 

한개의 선에서 신호를 절환시키면 다른 신호선들에서 신호가 변하도록 덧붙어 있는 
장치 를 시 동시 킨다. 실례 로 기 억기 가 읽기 조종신호를 람색 하였다면 자료모선들에 자료신호들 
을 배치한다. 이와 같이 발생과 작용사이의 관계는 사건들의 순서를 만든다. 화살표는 
이 의존관계를 보여 주기 위하여 시 간선도에 리용된다(그림 3-26 u ). 

박자신호선은 흔히 체계모선에 포함된다. 전자적박자는 박자신호선에 련결되며 반 
복적이 며 규칙 적 인 순서렬을 제 공한다. 다른 사건들은 박자신호에 동기 되 여 야 한다. 



[) 


박자 - 1 I- 1 I- 1 I- 1 I- 

그림 3-26. 시간선도 

T- 시간함수로서의 신호， L- 다중선, 원인과 결과의 의존관계，ᄅ-박자신호 
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제 4 장. 내부기억기 



♦ 를퓨터기 억기는 계층으로 이루어 진다. 가장 높은 준위는 처 리장치등록기들이 다. 
다음준위는 단일캐쉬와 L 1 과 L 2 로 표시되는 2준위캐쉬이다. 그다음준위는 일반 
적 으로 DRAM 으로 구성되 는 주기억기 이 다. 이 모든것들은 콤퓨터체 계 에서 내부 
기억기로 고찰된다. 기억기의 계층은 외부기억기로 확장되며 다음준위는 일반적 
으로 하드디스크이고 그다음은 ZIP 디스크，빛디스크와 자기레프 등 여러개의 준 
위로 구성된다. 

♦ 이 렇게 기 억기의 계 층을 구성하면 비 트당 가격 을 줄이 고 용량을 크게 하며 호출 
시 간을 줄인다. 하나의 최 고속기억 기 로만 리용하는것 이 좋지 만 값이 비싸기때 문 
에 속도가 른 기억기들을 많이 리용하여 허용한도와 호출시간을 유지하면서 가격 
을 눅게 한다. 이 기교는 요구되는 기억기단어를 일반적으로 더 빠른 기억기에서 
호출하도록 기 억 기 에 자료와 프로그람을 구성 하는것 이 다. 

♦ 일 반적 으로 처 리 장치 가 주기억 기 를 앞으로 맨 먼저 호출할 주소는 맨 마지 막으로 
호출했던 주소라고 보는것이 좋다. 그러므로 캐쉬는 DRAM 으로부터 가장 최근 
에 리용된 일부 단어들에 대 한 복사를 자동적 으로 진행한다. 만일 캐쉬 가 적 당히 
설계되였다면 이때에 대부분의 처려장치는 이미전에 캐쉬에 있는 기억기단어들을 
요구한다. 

♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦ 
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얼핏 보기에는 간단한것 같지만 콤퓨터기억기는 대체로 콤퓨터체계의 몇가지 특성 
들인 형，기술, 구성，성능，가격들과 같은 넓은 범위를 고려하여 실현된다. 콤퓨터체 
계의 기억기요구를 만족시키는 최량의 기술은 없다. 그러므로 전형적인 콤퓨터체계는 
일부 내부적 인 기 억 기 보조체 계 (처 리 장치 에 의 하여 직 접 호출가능한) 와 일부 외부적 인 
기 억 기 보조체 계 ( I 八) 장치 를 통하여 처 리 장치 가 호출가능한)들로 계 층을 이룬다. 

이 장은 내부기억구성요소들에 중점을 두며 한편 제 5 장은 외부기억체계를 서술 
한다. 제 1 절에서는 콤퓨터 기억기의 기본특성체계 를 서 술한다. 그다음 주기억 으로 리 
용되는 ROM , DRAM , SRAM 과 같은 반도체기억기들을 고찰한다. 다음으로 모든 현 
대적콤퓨터체 계 들의 본질적 인 구성 요소인 캐쉬기억기를 설명한다. 마지 막으로 현대적 
인 DRAM 방식을 고찰한다. 

제 1 절. 콤퓨터기억기체계의 일반개념 

1. 기억기체계의 특성 

만일 기억기들의 기본특성들에 따라 기억체계들을 갈라 놓으면 콤퓨터기억기의 복 
합체 는 더 관리 하기 가 쉽다. 이 것 들의 가장 중요한 점 들을 표 4-1 에 보여 주었 다. 

표 4-1 에서 위치라는 말은 기억기가 콤퓨터의 내부에 있는가 외부에 있는가 하는 

것을 의미한다. 내부기 억기는 흔히 
주기억기 라고 한다. 그러 나 내 부기 
억기에는 다른 형태들도 있다. 처리 
장치는 등록기형태로 자기의 국부기 
억기를 요구 한다(실례로 그림 2-3 참 
고) . 더우기 처리장치의 조종장치부 
분들도 자기의 내부기억기를 요구 한 
다. 다음장들에서 이 두가지 형태들에 
대 하여 론의한다. 캐쉬는 내부기 억기 
의 또 하나의 다른 형태이다. 외부 
기 억 기 는 처 리 장치 가 I/O 조종기 들을 
통하여 호출할수 있는 디스크나 자 
기레프와 같은 주변기 억장치들로 구 
성된 다. 

기억기의 명백한 특성은 용량이다. 
내부기억기에 대하여 그 특성은 일 
반적으로 바이트 ( lbyte =8 bit ) 혹은 
단어 라는 용어로 표현된다. 일반적 
인 단어길이는 8, 16, 32 bit 이 다. 외 
부기억기용량은 일반적으로 바이트에 의하여 표현된다. 

련관된 개념의 하나는 전송단위이다. 내부기억기에 대하여 전송단위는 기억기로부 
터 혹은 기억기모둘에로의 자료선의 수와 같다. 이것은 단어길이와 흔히 같지만 그렇 
지 않은 경우도 있다. 이 점을 명백히 하기 위하여 내부기억기에 대한 3 가지 련관개 
념들을 고찰하자. 


표 4-1. 콤퓨터기억기체계의 기본특성 


위치 

성능 

처리장치 

호출시 간 

내부 (1 차) 

주기 시간 

외 부 (2 차) 

전송속도 

용량 

물리적인 형래 

단어 크기 

반도체 

단어수 

자기 

전송단위 

빛 

단어 

자기-빛 

블 로크 

물리적 특성 

호출방법 

휘발성/비 휘발성 

순차 

지우기가능/지우기 불가능 

직접 

구성 

자유 


련상 
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• 단어: 기억기조직의 기본단위이다. 단어의 크기는 일반적으로 수를 표시하고 명 
령길이에 리용되는 비트의 수와 같다. 그러나 그렇지 못한 경우도 있다. 실례로 
CRAY -1 은 64 bit 단어길 이 를 가지지 만 24 bit 옹근수표현형 식 을 리 용한다. VAX 
는 여러개의 바이트들로 이루어 지는 다양한 길이의 명령들을 가지며 32 bit 의 
단어크기를 가진다. 

• 주소화단위 : 많은 체계들에서 주소화단위는 단어 이 다. 그러 나 일부 체계들은 바 
이트준위에서 주소화를 허가한다. 주소의 비트길이가 A 이고 주소화단위의 수가 
N 인 경 우 그 사이의 관계 는 2 A =N 이 다. 

• 전송단위 : 주기억기에서 이것은 한번에 주기억기에 대 한 읽기 혹은 쓰기를 위한 
비트수이 다. 전송단위의 요구는 단어 혹은 주소화단위와 같지 않다. 외부기억기 
에서 자료는 흔히 단어보다 더 긴 단위로 전송되며 이것을 블로크라고 한다. 

기억기형식을 구별하는 또 하나의 방법은 자료의 단위들을 호출하는 방법이다. 여 
기에는 다음과 갈은것들이 포함된다. 

• 순차호출: 기억기는 레코드라고 하는 자료의 단위들로 구성된다. 호출은 지정된 
선형순서로 진행되여야 한다. 기억된 주소화정보들은 개별적인 레코드들에 대하 
여 리용되며 회복과정도 같다. 공유된 읽기/쓰기기구를 리용하며 이것은 현재위 
치 로부터 목적위 치 까지 중간레 코드들을 무시 하고 통과시키 면서 이 동시켜 야 한다. 
따라서 임의의 레코드들을 호출하는 시간은 매우 다양하다. 레프장치들은 순차 
호출로 진행된다. 

• 직 접 호출 : 순차호출처 럼 직 접호출은 공유된 읽 기 -쓰기기 구를 포함한다. 그러 나 
개별적인 블로크 혹은 레코드들은 물리적위치에 기초한 단일한 주소를 가진다. 
주어 진 부분에 대 하여 직 접 호출로서 완성 되 는 기 억 기호출은 최 종위 치 에 도달할 
때까지 람색，계수，기 다림의 순서로 이루어 진다. 그러므로 호출시간은 서로 
다르다. 디 스크장치 는 직 접호출방식 이 다. 

• 자유호출: 기 억 기 에서 모든 주소화가능한 위 치는 유일하게 물리적배선에 의한 
주소화기구를 가진다. 주어 진 위치를 호출하는 시간은 선행한 호출들의 순서에 
무관계하며 상수이다. 따라서 임의의 위 치는 자유적 으로 선택할수 있으며 직 접적 
으로 주소화하고 호출할수 있다.주기억기와 일부 캐쉬체계는 자유호출기억기 다. 

• 련상호출: 이것은 지적된 단어배렬중의 한 단어안에서 요구되는 비트의 비교를 
진행하며 모든 단어 들에 대 하여 동시 에 이 조작을 진행하여 어 느 하나를 선택 하 
는 자유호출형태의 기억기이다. 따라서 단어는 주소에 의해서가 아니라 내용의 
일부분에 의하여 호출된다. 보통 자유호출기억기에서처럼 모든 위치는 자기의 
주소화기구를 가지며 호출시간은 위치 혹은 선행패턴호출들과 독립적으로 일정 
하다. 제 3절에서 론의하는 캐쉬기억기는 련상호출을 채용한다. 

사용자견해로부터 기억기의 가장 중요한 두가지 특성은 용량과 성능이다. 성능에 
는 다음의 세 가지 파라메터 들이 리 용된다. 

• 호출시간: 자료호출기억기 에 대 하여 호출시 간은 읽기 및 쓰기조작을 수행하는데 
걸리는 시간이다. 즉 주소가 기억기에 주어 진 순간부터 자료가 기억되거나 리 
용가능하게 될 때 까지 의 시 간이 다. 비 자유호출기억 기 에 대 하여 호출시 간은 요구 
하는 위 치 에서 읽기-쓰기기구를 배 치하는데 걸리는 시 간이 다. 

• 기 억기주기시간: 이 개념은 기본적으로 자유호출기억기 에 대 하여 적용되며 두번 
째 호출이 개시되기전에 요구되는 추가적인 시간에 호출시간을 더한것으로 이루 
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어 진다. 이 추가적인 시간은 자료를 파괴적으로 읽었을 때 신호선들을 안정시 
키거 나 자료들을 재 생하는 시 간이 요구된다. 

• 전송속도: 이것은 자료가 기억장치에로 혹은 기억장치로부터 전송되는 속도이다. 
자유호출기억기에 대하여 이것을 1/주기시간과 갈다. 

비 자유호출기 억기 에 대 하여 아래와 같은 관계 가 성 립 한다. 

t n = t a + I 

여기서 t n - 자개의 비트를 읽기 혹은 쓰기 위한 평균시간, 
t a - 평균호출시간， 

N - 비 트수， 

及 - 전송속도 ( bps ) 

기억기의 다양한 물리적 형래가 사용되고 있다. 오늘 가장 일반적인것은 반도체기 
억기，디스크와 자기레프에 리용되는 자성면기억기，빛과 자기빛기억기들이 다. 

자료기 억의 여 러 가지 물리적 특성들은 중요하다. 휘 발성기 억기 에서 전원이 차단되 
였을 때 정보는 본질적으로 잃게 된다. 비휘발성기억기에서 일단 기억된 정보는 고의 
적으로 변경시키지 않는 한 유지된다. 즉 정보를 유지하는데 전원을 요구하지 않는다. 
자성면기 억기는 비휘 발성기 억기 이 다. 지울수 없는 기 억기는 기 억장치파피를 제외 하고 
변 경 될 수 없 다. 이 러 한 형 태 의 반도체 기 억 기 를 ROM (read only memory ) 이 라고 한다. 
실제적으로 지울수 없는 기억기는 비휘발성기억기이다. 

자유호출기억기에 대하여 구성은 기본설계지표이다. 구성에 의하여 단어를 형성하 
는 비트들의 물리적배렬을 결정한다. 얼마 후에 설명하는바와 같이 명백한 배렬이 항 
상 리용되지 못한다. 


2. 기억기의 계층 

콤퓨터의 기억기를 제한하는 설계는 세가지 질문 즉 얼마나 용량이 커야 하는가， 
얼마나 빨라야 하는가，얼마나 비용이 많이 드는가에 의하여 종합된다. 

얼마나 용량이 커야 하는가하는 질문은 비교적 해결되였다. 용량에 대하여 말 
한다면 응용프로그람들은 용량의 크기에 맞게 개발될것이다. 속도가 얼마나 빠른 
가하는 질문은 어 떤 의미 에서 쉬운 대 답이 다. 더 높은 성 능을 달성 하기 위하여 기 
억기는 처 리장치속도에 뒤떨어 지지 말아야 한다. 즉 처 리 장치 가 명 령들을 집행하 
고 있을 때 명령들과 연산수들에 대한 기다림으로 하여 정지되지 말아야 한다. 마 
지막질문도 고찰하여 야 한다. 실제 로 체 계 에서 기 억기의 가격 은 다른 구성요소들 
에 비하여 알맞춤하여 야 한다. 

상품화에서는 기억기의 세가지 기본특성 즉 가격, 용량，호출시간 등이 알맞을것 
을 요구한다. 주어 진 임의의 시점에서는 여러가지 기술들이 기억기체계들을 실현하는 
데 리용된다. 기술들의 이 부분들은 서 로 교차되며 다음관계 가 성 립 한다. 

• 호출시간을 빠르게 하면 비트당 가격 이 높아 진다. 

• 용량을 크게 하면 비트당 가격 이 눅어 진다. 

• 용량을 크게 하면 호출시간은 떠진다. 
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그림 4-1 .기억기의 계층 

설 계 자의 고충은 명 백하다. 설 계 자는 용량을 만족시키 면서 비 트당 가격 이 눅은 대 
용량기 억 기를 제 공하는 기 억기 기 술들을 리용할것을 바란다. 그러 나 성 능요구에 대 
하여 설 계 자는 비 싼 비 용을 들여 빠른 호출시 간을 달성할수 있는 상대 적 으로 적 은 
용량의 기 억 기 를 설계하게 된다. 

이 고충을 해결하는 방법은 단일기억기구성 혹은 기술로 해결하지 못한다. 그러나 
기억기의 계층화를 실현하면 해결할수 있다. 표준적인 계층화를 그림 4-1 에 주었다. 
계 층화를 실현할 때 다음과 같은 문제 들이 발생한다. 

비트당 가격이 감소한다. 

용량이 증가한다. 

C . 호출시 간이 증가한다. 

H . 처 리 장치 에 의한 기 억기의 호출주기 는 감소된다. 

따라서 용량이 작고 많은 비용이 들며 빠른 기억기는 용량이 크고 비용이 적게 들 
고 속도가 뜬 기억기에 의하여 보상된다. 이 구성의 성공적인 열쇠는 근조건이다. 즉 
호출시 간의 감소이 다. 이 장의 뒤 에서 캐쉬 기억 기와 제 7 장에서 가상기 억기를 론의 할 
때 더 상세한 개념을 설명한다. 여기에서는 간단히 설명한다. 

처 리 장치가 2개 준위의 기 억기 에 대한 호출을 진행 한다고 가정 하자. 1준위는 1000 
개 의 단어 를 가지 고 있고 0.1 /xs 의 호출시 간을 가지며 2 준위 는 100000개의 단어 를 가 
지고 있고 1 /zs 의 호출시간을 가진다. 만일 호출되는 단어가 1 준위에 있다고 가정하 
면 그때 처려장치는 그것을 직접 호출한다. 만일 단어가 2 준위에 있으면 단어는 처음 
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에 1 준위에로 전송되며 그다음 처리장치에 의하여 호출된다. 간단히 하기 위하여 처 
리 장치 가 단어 가 1 준위 에 있는가 2 준위 에 있는가를 검 사하는데 요구되 는 시 간을 무시 
하자. 그림 4-2 에서는 이 조건을 무시한 그라프의 형 태를 보여 주었다. 이 그림은 명 
중률 H 의 함수로서 두 준위기억기에 대한 평균호출시간을 보여 준다. 여기서 H 는 고 
속기억기(실례로 캐쉬기억기)에서 명중된 모든 기억기호출비률의 역수로서 정의되며 
는 1준위에서 호출시간이며 T 2 은 2준위에서의 호출시간이다. 보는바와 같이 1준위 
호출의 높은 비률에 대하여 평균 총 호출시간은 2준위의것보다 1 준위의것에 더 가깝다. 

실례 에서 기 억기호출의 95%가 캐쉬 에서 명중되 였다고 가정 하자. 이때 한 단어의 
평균호출시간은 다음과 같이 계산된다. 

(0.95) (0.1 // s ) +(0.05) (0.1 jus +1 // s )=0.095+0.055=0. 15 jus 

조건 자로부터 근까지가 적용된다면 이러한 원리로 작업한다. 여러가지 기술을 채 
용한것 에 의한 기 억 기체계 들의 변화는 조건 1로부터 도 까지 만족하게 하였다. 다행 히 
도 조건 근는 일반적으로 타당하다. 

조건 근의 타당성에 대한 기본근거는 참조의 국부성이라고 하는 원리이다 
[ DENN 68]. 프로그람집행과정에 기억기는 처리장치에 의 하여 참조되며 명령들이 나 
자료들은 기억기에 밀집되여 있다. 프로그람들은 일반적으로 여러번 반복되는 순환과 
보조프로그람들을 포함하며 일 단 순환고리 나 보조프로그람이 집 행되면 작은 명 령모임 
들에 대한 참조를 반복한다. 마찬가지로 표들과 배렬들에 대한 연산들은 밀집된 자료 
단어 들의 묶음에 대 한 호출을 진행한다. 오랜 시 간 지 나면 리 용되 는 클라스터 (밀집된 
부분)들은 변하지 만 짧은 시 간동안에는 처 리 장치 가 기 억기의 고정된 클라스터들에서 
작업 한다. 

그러므로 모든 련속적인 낮은 준위에 대한 호출비률이 웃준위에 대한 호출비률보 
다 실제 적 으로 작으므로 계 층에 따라 자료를 구성하는것 이 가능하다. 이 미 고찰한 2 
개 준위의 실례를 보자. 2준위기 억기는 모든 프로그람명 령들과 자료들을 다 포함한다. 
현재 클라스터들은 1 준위에 림시적으로 배치되여 있다. 시간이 지나면 1 준위로 들어 
오는 새로운 클라스터를 배 치할수 있게 1 준위 에 있는 클라스터들중 어느 한개는 2 준 
위로 다시 복귀된다. 그러나 평균적으로 대부분 참조는 1 준위에 있는 명령과 자료들 
이 다. 

이 원리는 그림 4-1 에서 보여 준 계층에서 알수 있는바와 같이 2개 이상의 준위를 
가진 기억기체계들에 적용할수 있다. 더 빠르고 더 용량이 작으며 더 비용이 많이 드 
는 기 억 기 형 태 는 처 리 장치 내 부에 있는 등록기 들이 다. 일 반적 으로 처 리 장치 는 한타스정 
도의 등록기를 가지며 일부 처 리 장치들인 경우에는 수백개의 등록기들을 가진다. 간단 
히 2 개 준위 로 하면 주기억기는 콤퓨터의 기본내부기 억기 이 다. 주기억기 에서 모든 기 
억 위 치 는 유일 한 주소이 며 대 부분의 기 계 명 령 들은 하나이 상의 주기억 주소들에 포함된 
다. 주기억기는 보통 더 속도가 빠르고 용량이 작은 캐쉬 로 확장한다. 캐쉬는 프로그 
람작성 자에 의하여 실 제 로는 처 리 장치 에 의하여 볼수 없 다. 성 능을 개 선 하기 위하여 
주기억 기와 처 리 장치등록기들사이 에 자료전송을 보장하기 위한 장치 이 다. 

지금까지 서술한 기 억기의 세 가지 형 태는 휘 발성이며 반도체기술을 도입하였다. 
이 3 개 준위 들의 리 용은 반도체 기 억 기 가 가격 과 속도가 서 로 다른 여 러 가지 형 태 들로 
되 여 있 다는 점 을 고려한다. 자료는 하드디 스크나 비직 결형매체 들 즉 디 스크， 자기 테 
프, 빛기억기와 갈은 대용량외부기억장치들에 영구적으로 기억된다. 외부적인 비휘발 
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성기억기를 2 차기억기 혹은 보조기억기 라고도 한다. 이것들은 프로그람과 자료파일들 
을 기 억 하는데 리 용되 며 보통 개 별적 인 바이 트와 단어 들에 대 해 서 가 아니 라 파일 이 나 
레코드라는 용어로만 프로그람작성자에 의하여 볼수 있다. 디스크는 또한 제 7 장에서 
론의 하는 가상기 억 기 로서 주기 억 기 확장을 제 공한다. 

기억기의 다른 형태들은 기억기계층에 포함 
된다. 실례로 대형 IBM 콤퓨터들은 확장기 억기 
로 알려 진 내 부기 억기를 리용한다. 이 기 억 
기 는 주기억기 보다 속도가 뜨고 비 용이 적 게 
드는 반도체기술을 리용한다. 엄격히 말하면 
이 기억기는 기억기계층에 적합치 않지만 한 
측면부분을 이 분다. 자료는 주기억 기 와 확장 
기억기사이에 전송될수 있지만 확장기억기와 
외 부기 억 기 사이에 는 전송될 수 없 다. 2 차기억 
기의 또 다른 형 태들은 빛디 스크와 자기빛 디 
스크이다. 마지막으로 더 추가되는 준위들은 
프로그람에서 기억기계층에 효과적으로 첨부 
될수 있다. 주기억기의 일부는 디 스크로부터 
읽어 진 자료를 림시적으로 보관하는 완충기 
로서 리용될수 있 다. 이 와 같은 기 술은 때 때 
로 디스크캐쉬 1이라고 하며 다음의 두가지 방 

법으로 성능을 개선한다. 

• 디스크쓰기들을 묶어서 진행한다. 이 렇게 하면 수많은 자료의 작은전송들을 어 
느 정도 큰 자료전송으로 만든다. 이것은 디스크의 성능을 개선하며 디스크에 
대한 처 리장치의 관련성을 최소로 한다. 

• 출력 으로 미 리 정해 진 일부 자료들은 디스크에 기 억되기전에 프로그람에 의하 
여 참조될수 있다. 이 경우에 디스크로부터 느리게 참조되기보다는 프로그람 캐 
쉬로부터 빨리 참조될수 있다. 

부록 4-1 에서 는 여 러 준위 기 억기구조의 밀접한 성능관계들을 설명하였다. 

제2 절. 반도체주기억기 

종래의 콤퓨터들에 서 콤퓨터 주기 억기 로서 리 용한 대부분의 자유호출기 억기의 일반 
형 태는 자심 기 억기 라고 하는 원통모양의 자기철심 고리들의 배 렬이 였다. 그리 하여 주기 
억기를 흔히 자심 기억기라고 하였다. 미소전자공학의 출현과 실현은 자심기억기를 성 
공한 때로부터 긴 세월이 걸렸다. 오늘 주기억기를 위한 반도체소편들의 리용은 거의 
공통이다. 이 기술의 기본내용들을 이 절에서 설명한다. 



기억기의 성능 


1 디스크캐쉬는 일반적으로 하나의 순수한 쏘프트웨어 기술인데 이책에서는 론의하지 않겠 
다. [ STAL 98] 을 참고 
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1. 자유호출반도체기억기의 분류 


이 절에서 제공하는 모든 기억기형태들은 자유호출기억기이다. 즉 기억기의 개별 
적 인 단어들은 배선된 주소론리를 통하여 직접 호출된다. 

표 4-2 는 반도체기억기의 기본형태들을 주었다. 대부분의 보편적인것들을 RAM 
( random-access memory ) 이라고 한다. 물론 이것은 표에서 모든 형태들이 자유호출 
이므로 잘못 쓰인 용어이다. RAM 의 구별되는 특성은 기억기로부터의 자료읽기와 기 
억기에로의 자료쓰기를 쉽고 빠르게 할수 있다는것이다. 읽기와 쓰기는 전기적신호에 
의하여 달성된다. 


표 4-2. 반도체기억기의 형래 


기억기의 형태 

부류 

지우기 

쓰기 방식 

휘발성 

자유호출기 억 기 ( RAM ) 

읽기-쓰기 기억기 

전기적으로 
바이트준위 

전기적으로 

휘발 

읽 기 전용기 억 기 ( ROM ) 



(금지됨) 


프로그람가놓한 

ROM ( PROM ) 

읽기전용기억기 

불가능 



소거 가능한 

PROM ( EPROM ) 


자외선， 

소편준위 

전기적으로 

비 휘 발 

플라쉬기억기 

읽 기 기 본기 억 기 

전기적으로， 

블로크준위 

전기적으로 소거가능한 
PROM ( EEPROM ) 


전기적으로， 
바이트준위 




RAM 의 다른 구별특성 은 휘 발성 이다. RAM 은 정 상적 으로 전원을 공급하여 야 한 
다. 전원이 중단되면 자료는 잃어 버 린다. 따라서 RAM 은 오직 림시적 인 기억기로서 
만 리용될수 있다. 

RAM 기술은 두개의 기술. 즉 정적기억기，동적기억기로 나누어 진다. 동적 RAM 
은 축전기 의 충전과정 으로서 자료를 기 억하는 세 포로 만들어 진다. 축전기 에 서 충전 
혹은 방전은 2 진수 1 혹은 0 으로서 표현된다. 축전기들은 저절로 방전되는 경향성을 
가지 며 동적 RAM 들은 자료기 억 을 유지 하기 위 한 재 생 동작인 주기 적 인 충전을 요구한 
다. 정적 RAM 에서 2 진값들은 전통적 인 방아쇠론리 문구성들을 리용하여 기 억 한다(방 
아쇠의 서술에 대하여 부록 I 참고). 정적 RAM 은 전원이 공급되는 동안에만 자료를 
보존한다. 

정 적 RAM 과 동적 RAM 들은 휘 발성 이 다. 동적 기 억 기 세 포들은 간단하며 정 적 기 억 기 
세 포보다 작다. 따라서 동적 RAM 은 밀도가 높으며 정 적 RAM 에 비 하여 비 용이 적 게 든 
다. 다른 한편 동적 RAM 은 재생회 로를 지원할것을 요구한다. 큰 기 억기의 경우에 재생 
회로의 가격이 고정되여 있으므로 동적기억기세포들의 작은 가격변화에 의하여 보상되 
는것보다 더 리득이다. 따라서 동적기억기는 큰 기억기가 필요한 곳에 쓰는것이 좋다. 
마지 막문제 는 정 적 RAM 들이 일 반적 으로 동적 RAM 들보다 좀 더 빠르다는것 이 다. 

RAM 에 대 조되 는것 은 ROM (read only memory ) 이 다 . 이 름 이 말해 주는것 처 럼 
ROM 은 변화시 킬수 없는 영구적 인 자료패 런들을 포함한다. ROM 을 기본적으로 응용 
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하는것 은 제 4 편에서 론의하는 마이크로프로그람조종방식 이 다. 다른 가능한 적 용은 
다음과 갈다. 


• 자주 쓰이는 기능들에 대한 서고보조루린 

• 체 계 프로그람 

• 함수표 

적 당한 크기의 요구에 대 하여 ROM 의 우점은 자료 혹은 프로그람이 항시적으로 
주기억 기 에 있으며 2차기억 기 로부터의 넣 기를 요구하지 않는다는것 이 다. 

ROM 은 다른 집적회로소편들과 마찬가지로 제조공정의 한 부분으로서 자료를 실 
제적 으로 소편속에 삽입하여 만든다. 이것은 다음의 두가지 문제를 제 기한다. 

• 자료삽입단계는 비 교적 높은 고정된 가격 을 포함하며 개 별적 인 ROM 에 대 하 
여 하나 혹은 수천개의 복사물이 제작된다. 

• 오유가 발생할 공간이 없 다. 만일 한 비 트가 오유라면 전체 ROM 묶음은 버 려 
야 한다. 

개별적기억내용을 가진 적은 량의 ROM 이 요구될 때 비용을 적게 들일수 있는 한 
가지 방법 은 프로그람가능한 ROM ( PROM ) 을 리 용하는것 이 다. ROM 과 같이 PROM 은 
비휘 발성기 억기 이며 한번 쓰기를 진행할수 있다. PROM 에 대 하여 쓰기과정은 전기적 
으로 진행 하며 기 본소편제작후에 공급자나 거 래 자에 의하여 수행 된 다. 쓰기 혹은 프로 
그람화과정 을 위하여 특수한 기 구가 요구된다. PROM 들은 유연성 과 편리 성 을 제 공한 
다. ROM 은 높은 생 산성 으로 하여 인기 를 가지 고 있 다. 

ROM 에서 또 하나의 변종은 읽기조작이 쓰기조작보다 더 자주 진행되지만 비휘발 
성기억기를 요구하는 응용프로그람에 대하여 효과적 인 read-mostly memory (읽기기본 
기 억 기 ) 이 다. 여 기 에 는 읽 기 기 본기 억 기 로서 3 가지 일 반적 형 식 들 즉 EPROM , 
EEPROM , flash (고속지 우기 ROM ) 기 억 기 가 있 다. 

빛소거 형 프로그람가능한 읽 기전용기 억 기 任 PROM ) 는 PROM 과 같이 전기 적 인 읽 
기 와 쓰기 를 진행한다. 그러 나 쓰기 조작전에 모든 기 억세 포는 자외 선으로 소편을 비 쳐 
서 초기 상태 와 같이 지 우기 를 해 야 한다. 이 지 우기 과정 은 반복하여 진행할수 있 다. 
즉 매 번 지우기를 끝내 려 면 길어서 20 분정도 걸릴수 있다. 따라서 EPROM 은 여 러 번 
변경 시 킬수 있으며 ROM 이 나 PROM 과 같이 실제 적 으로 명 백하게 자료를 유지 하지 
못한다. 기억의 원가를 비교하면 EEPROM 은 PROM 보다 더 많은 비용이 들지만 여 
러번 갱 신할수 있는 능력을 가진다는 우점 이 있다. 

읽 기기 본기억기의 더 능률적 인 형 태는 전기소거형프로그람가능한 읽기 전용기 억기 
( EEPROM ) 이 다. 이 기 억 기는 이미 존재하던 내용을 지 우지 않고 임의의 순간에 쓰기 
할수 있는 읽기기본기억기 이 다. 즉 주소화된 한바이트 혹은 여 러개의 바이트들에 대하 
여서만 갱신될수 있다. 쓰기조작은 읽기조작보다 상대적으로 더 길다. 즉 바이트당 수 
백 us 걸린다. EEPROM 은 정상적 으로 설 치되 여 있는 모선조종，주소와 자료모선을 
리 용하여 콤퓨터 에 설 치된 상에서 갱 신할수 있는 유연성과 비휘 발성의 우점 들을 가지 
고 있다. EEPROM 은 EPROM 보다도 비 용이 많이 들며 밀도가 높지 못하다. 즉 소편 
당 비트수가 작다. 

반도체 기 억기의 또 하나의 다른 형 태는 플라쉬기 억기 (프로그람갱 신속도가 빠르다 
는데 로부터 유래 된 말이 다. ) 이 다. 1980년대 중엽 에 처 음으로 소개 되 였 으며 플라쉬 기억 
기 는 가격 과 기 능적 으로 보면 EPROM 과 EEPROM 사이 에 중간 정 도로 된 다. 
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EEPROM 과 같이 플라쉬 기억기는 전기소거 기술을 리 용한다. 플라쉬 기억기의 전체 내 
용은 1 〜수초사이 에 지 울수 있으며 따라서 EPROM 보다 고속이다. 또한 소편전체 가 
아니 라 기 억기의 블로크단위 로 지우는것 이 가능하다. 그러 나 플라쉬 기억기는 바이트준 
위의 지우기를 진행할수 없다. EPROM 과 같이 풀라쉬기억기는 오직 비트당 한개의 3 
극소자를 리 용하며 이 로부터 EPROM 과 같이 높은 밀도를 달성할수 있 다 

2. 조직 


반도체기 억기의 기 본요소는 기 억기세포이 다. 비록 다양한 전자기 술들이 리용되 지 
만 모든 반도체기억기세포들은 다음의 속성들을 공동으로 가진다. 

• 2진수 1과 0 을 표현하는데 리 용할수 있는 두개 의 안정 한 상태 를 가진다. 

• 상태를 설정하기 위한 쓰기능력을 가진다. 

• 상태를 읽기 위한 능력을 가진다. 

그림 4-3 에는 기억기세포의 조작을 제시하였다. 가장 일반적으로 세포는 전기적신 
호를 전송하는 능력을 가진 3 개의 기능적 인 단자들을 가진다. 이 름이 암시하는바와 
같이 선택단자는 읽기 혹은 쓰기조작을 위한 기억기세포를 선택한다. 조종단자는 읽기 
인가 쓰기인가를 지 적 한다. 쓰기 에 대 하여 나머지단자는 1 혹은 0 으로 세 포의 상태 를 
설정하는 전기적신호를 제공한다. 읽기에 대 하여 이 단자는 세포의 상태를 출력하는데 

리용된다. 기억기세포의 


조 


선택 


자료입력 선택 


자료입력 







기) 


L ) 



그림 4-3. 기억기세포조작 
ᄀ-쓰기 L - 읽기 


내 부적구성 과 기 능, 동기 
화의 세 부고찰은 리용되 는 
지적된 집적회로기술에 의 
존되며 이 책의 범위를 초 
과하는것 으로 된다. 목적 
상 주어 진 개별적인 세포 
들을 읽기와 쓰기조작을 위 
하여 선택할수 있 다는것 을 
알면 된다. 


3. 소편론리 

다른 집적회로소편들과 마찬가지로 반도체기억기는 소자들로 제작된다. 매 소자들 
은 기억기세포들의 배렬들로 이루어 진다. 

전체 기억기계층에서 속도，용량, 가격과 같은 상품지표들이 있다는것을 보았다. 
이 상품지 표들은 한 소편에 서 기 억 기세 포들의 구성과 론리 적기 능들을 고찰할 때도 필 
요하다. 반도체기억기들에 대하여 기본설계지표의 하나는 동시에 읽기/쓰기할수 있는 
자료의 비트수이다. 하나의 극단적인 방법은 기억기에서 단어들의 론리적인 배렬과 같 
게 물리적세포들의 배렬을 구성하는것이다. 배럴은 B 개의 비트들로 이루어 진 W 개의 
단어들이 구성된다. 실례로 16 Mbit 소편은 1 M 개의 16 bit 단어들로 구성될수 있다. 다 
른 극단적 인 방법은 자료가 한번에 lbit 씩 읽기/쓰기되는 lbit 소편구성 이 라는것 이 다. 
DRAM 과 같은 기 억 기 소편구성 을 말할수 있 다. ROM 구성 도 비 슷하다. 

그림 4-4 에서는 16 Mbit DRAM 의 일반적 인 구성을 보여 주었다. 이 경우에 4 bit 
가 동시 에 읽 기 혹은 쓰기된다. 론러 적 으로 기 억 기 배 럴은 2048 X 2048 요소들의 4 각형 
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배럴로 구성된다. 여러가지 물리적배렬들도 가능하다. 임의의 경우에 배렬의 요소들은 
수평(행)과 수직(렬)선들에 의하여 련결된다.모든 수평선들은 자기 행에 있는 모든 세 
포들의 선택단자에 련결된다. 모든 수직선들은 자기렬에 있는 모든 소편들의 
Data - in/Sense 단자들에 련결된 다. 

주소선들은 선택되는 단어의 주소를 계공한다. 총 log 2 W 의 선들이 요구된다. 실 
례 로 11개 의 주소선들은 2048 개 행 들의 하나를 선택할수 있게 한다. 이 11개 의 선들은 
11 개의 입구와 2048 개의 출구를 가진 행 해 신기 에 입구된다. 해 신기의 론러 는 11 개의 
입구선들에서 주어 지는 비트렬에 따라 2048 개의 출구가운데서 한개를 능동상태로 만 


RAS CAS ^ CE 



그림 4-4. 일반적인 16 Mbit DRAM (4 MX 4) 


든다 (2 U =2048). 

추가적으로 입력되는 11 개의 주소선들은 렬마다 4 bit 로 구성된 2048 개의 렬들가 
운데서 한개를 선택한다. 4 개의 자료선들은 자료완충기와 4 bit 입구와 출구로 리용된 
다. 입력 (쓰기)에서 모든 비트선들에 대한 구동기는 자료선에 대응하는 값들에 일치하 
는 1 혹은 0 으로 동작한다. 출력 (읽기)에서 모든 비트선들의 값은 읽기증폭기를 통과 
하여 자료모선으로 나간다. 행선은 행의 세포들이 읽기 혹은 쓰기에 리용되도록 선택 
한다. 

이 DRAM 에 서 4 개 의 비 트들로만 읽 기 /쓰기 되 므로 모선 에 서 한 자료단어 를 읽 기 / 
쓰기 할수 있게 기억기 조종기에 여러개의 DRAM 들을 련결하여야 한다. 

2048 X 2048 배렬에 필요한 수의 절반인 11 개의 주소선 ( A 0 〜 A 10 ) 만이 존재한다는 
것을 주목하자. 

이것은 단자들의 수를 절약하기 위한것이다. 요구되는 22 개의 주소선들은 외부에 
있는 선택론리를 통하여 소편에로 통과하며 11 개의 주소로 다중분배된다. 첫 11 개 주 
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소신호들은 배렬의 행주소를 지적하기 위하여 소편에 들어 가며 그다음의 다른 11 개 
주소신호들은 렬주소로 된다. 이 신호들은 소편에 동기를 제공하기 위한 행주소선택 
( RAS ) 과 렬 주소선 택 ( CAS ) 에 의 하여 동기 화된 다 . 

다중분배 식 주소화는 새 롭게 갱 신되 는 모든 기 억 기 소편들에 서 4 배 의 기 억 기 크기 를 
가지게 하는 정 4 각형배렬의 리용을 추구한다. 주소가 하나 증가하면 행과 렬의 수가 
각각 증가하므로 소편기 억기의 크기는 4배단위로 증가한다. 

그림 4-4 는 재 생 회 로가 포함되 였 음을 가리 킨다. 모든 DRAM 들은 재 생 조작을 요 
구한다. 재생을 위한 단순한 기술은 실제상 모든 자료세포들이 재생되는 동안 DRAM 
소편을 리용할수 없게 하는것이다. 재생계수기는 모든 렬들을 지적한다. 매개 렬을 재 
생하기 위 하여 재생 계수기 로부터 나오는 출력선들은 렬해 신기 에 공급되며 RAS 신호가 
능동으로 된 다. 이 것 은 재 생 하려 는 렬 에 있는 모든 세 포들을 재 생 시 킨다. 

4. 소편팩키지화 

제 2 장에서 언급한바와 같이 직 접회 로는 다른 장치들에 련결하기 위한 단자들을 
포함하는 팩 키지에 설치된다. 

그림 4-5 가는 1 MX 8 로 구성된 8 Mbit 소편인 EPROM 펙키지실례를 주었다.이 경 
우에 구성은 한단어 배렬팩키지 로서 취급된다. 팩키지는 표준소편팩키지규격의 하나인 
32개의 단자를 가지고 있다. 단자들은 다음과 같은 신호선들을 제공하고 있다. 32개의 
단자를 가지고 있다. 



그림 4-5. 대표적인 기억소자단자와 신호 
ᄀ- 8 Mbit EPROM , l -16 Mbit RAM 
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접지 단자 ( Vss ) 

소편허 가단자 ( CE ). 매 개 소편들이 같은 주소모선에 의하여 쭉 
의 기억기소편들이 존재하므로 CE 단자는 지적되는 주소가 해 
것 인가 아닌가를 지 적하는데 리 용된다. CE 단자는 주소모선의 
된 론리 회 로에 의하여 작용한다. 

쓰기조작동안 공급되 는 프로그람쓰기전압단자 

적 인 DRAM 단자구성 은 4 M X 4 로 구성 된 16 Mbit 소편으로 그 
1-. ROM 소편과는 여 러 가지 차이점 이 있다. RAM 은 갱 신할수 
요력/출력기능을 가진다. 쓰기허가 ( WE ) 와 출구허 가 ( OE ) 단자， 









가 읽 기 조작인가를 지 적 한다. DRAM 이 행 과 렬 에 의하여 호출되 고 주소가 다중분배 
식 이 므로 4 M 행/렬결합(2 11 X 2 U =2 22 ) 을 지 적 하는데 11 개의 주소단자가 요구된다. RAS 
와 CAS 단자들의 기 능은 앞에 서 론의 되 였 다. 

5. 장치조직 


RAM 소편이 단어 당 lbit 를 포함한다면 이때 명백 히 적 어도 단어당 비 트수와 같은 
소편수가 요구될것 이 다. 실례 로 그림 4-6 에서는 256 KX 8 bit 단어 로 이루어 지는 기 억 


기억 주소 



1 개 선택 


그림 4-7. IMbbyte 기억기조직 


기장치를 어떻게 구성 하는가를 보여 주었다. 2的 K 단어들에 대하여 18 bit 주소가 요구 
되며 일부 외부원천대상들로부터 장치에 주어 진다. 주소는 8개의 256 KXlbit 소편들 
에 제공된다.여기서 매개 소편들은 lbit 입 력/출력선을 가진다. 이 구성은 기 억기의 
크기가 소편당 비트수와 같은 경우에만 실현할수 있다. 더 큰 기억용량이 요구되는 경 
우에 소편의 배 럴들이 요구된다. 그림 4-7 에서 는 8 bit 단어 로서 1 M 단어 크기의 기 억 기 
에 대한 가능한 구성을 보여 주었다. 이 경우에 그림 4-6 에서와 같이 배렬된 256 K 단 
어를 포함하는 장치 4개로 구성한다. 1 M 단어 에 대 하여 20개의 주소선이 요구된다. 아 
래의 18개의 비 트들은 32개의 모든 소편들에 배선한다. 우의 2 bit 는 4개의 장치묶음 
들중 한 장치에 소편허가신호를 보내는 그루빠선택론리장치에 입력시킨다. 


6. 오유수정 


반도체 기 억 기 체 계 는 오유문제 들을 가진 다. 이 것 은 파괴 적 인 오유와 비 파괴 적 인오 
유들로 나눌수 있다. 파괴적인 오유는 작용을 받은 기억기세포 혹은 세포들이 믿음성 
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있게 자료를 기 억할수 없게 하는 영구적 인 물리적고장이 다. 즉 0 혹은 1 로 고정되거 나 
0 과 1 사이 에 불안정하게 바뀐다. 이 오유는 매우 거 치른 환경 에서의 리용이 나 제 작상 
오유, 장치의 피로에 의하여 발생한다. 비파괴적 인 오유는 기억기파괴가 없이 하나 혹 
은 여러개의 기억세포들의 내용을 변화시키는 자유적이고 비파괴적인 사건에 의한 오 
유이 다. 비 파괴 적 인 오유는 전원공급문제 들이 나 미 세 한 a 선알갱 이 에 의 하여 발생 한다. 
이 미세한 a 선알갱 이 는 일 반적 으로 모든 금속들가까이 에서 적 은 량으로 방사성알갱 이 
들이 나타나므로 생기는 방사성부식으로부터 나타나며 이것으로 하여 기억기사용을 불 
편하게 한다. 이 파괴 적 인것 과 비파괴 적 인 오유들은 시 끄러 우므로 대 부분 현대 주기억 
기 들은 오유를 검 사하고 수정 하기 위한 론리 회 로들을 포함하고 있 다. 


오유신호 


자료출력 


자료입력 



그림 4-8. 오유수정부호 


그림 4-8 은 어떤 과정으로 오유수정이 진행되는가를 일반적인 과정으로 설명 
하였 다. 자료가 기 억 기 로부터 읽 기 될 때 함수 F 로 주어 지 는 계산은 부호를 생 성하기 
위하여 자료에 대하여 수행된다. 부호와 자료는 기억된다. 따라서 M 비트단어의 자료 
가 기 억되고 부호를 K 비트길이 라고 하면 기 억된 단어의 실제길이는 M+K 비트이다. 

이전에 기 억된 단어를 읽기할 때 부호는 오유를 검사하고 가능한껏 수정하는데 리용 
된다. K 개의 부호비트들의 새로운 묶음은 M 개의 자료비트들로부터 생성되며 꺼내여 
진 부호비트들과 비교된다. 

비교결과는 다음의 세가지 결과중의 하나로 나타난다. 

• 오유가 탐색되지 않았다. 꺼내여 진 자료는 전송된다. 

• 오유가 발견되였고 오유수정이 가능하다. 자료비트들과 오유수정비트들을 묶 
어서 전송하기 위 한 수정된 M 개의 비 트묶음을 만드는 수정장치 에 로 들여 보 
낸다. 
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• 오유가 발견되 였으나 수정할수 없다. 이 조건은 통보된다. 

이러한 형태로 만든 부호를 오유수정부호라고 한다. 부호는 수정하고 검사할수 있는 
단어의 오유비트수에 의하여 특징 지어 진다. 



가장 간단한 오유수정부호는 Bell 연구소의 리 차드 하밍 에 의 하여 제 안된 하밍부호 
이다. 그림 4-9 에서는 4 bit 단어들에 이 부호의 리용을 설명하기 위하여 벤의 그림풀이 
를 리용하였다. 3 개의 겹쳐 있는 원들로 7 개의 작은 부분을 만든다. 4 개의 자료비트 
들은 안쪽의 작은 부분들에 배 치한다(그림 4-9 1). 나머지 작은 부분들은 기 우성 비 트 
들로 채 워 넣 는다. 매 개 기 우성비 트들은 해 당 원에서 1 의 수가 우수가 되 도록 값을 
설정한다(그림 4-9 L ). 따라서 원 A 는 3개의 1을 포함하므로 이 원의 기우성비트는 
1 로 설정된다. 이제 오유로서 자료비트들중 하나가 변하였다면(그림 4-9 n ) 쉽게 알 
수 있다. 기우성비 트들을 검 사하면 모순은 원 A 와 원 C 에서 발생 하고 원 B 에서는 
발생하지 않았다. 반드시 7 개의 작은 부분들중에 변한것은 A 와 C 에 있으며 묘 에는 
없 다. 그러 므로 오유는 찾은 비 트를 변경 시 켜 수정할수 있 다. 

포함되는 개념들을 명백히 하기 위하여 8 BIT 단어에서 한개의 비트오유를 찾고 수 
정할수 있 는 부호를 개 발하자. 

먼저 얼마나 긴 부호가 있어 야 하는가를 계산하자. 그림 4-8 을 참고하면 비 교론 
리는 2 개의 K 비트값들을 입구로 받아 들인다. 비트와 비트사이 비교는 두 입구들의 
안맞음론리합으로 진행된다. 그 결과를 신드롬단어라고 한다. 따라서 신드롬의 매 비트 
는 두 입구렬에 대하여 해당한 위치의 비트들이 같은가 갈지 않은가에 따라 0 혹은 1 로 
된다. 그러므로 신드롬단어는 K 개 비트폭으로 되며 0 부터 2 K -1 사이의 값을 가진다. 
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그림 4-10. 자료비트와 검사비트의 배1 
여 기서 기 호 ©는 안맞음론리합을 의 미한다. 
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값 0 은 오유가 없 다는것 을 의 미하며 나머 지 2 K -1 개 의 값들은 만일 오유가 있 다면 
어느 비트에서 오유가 발생했다는것을 지적한다. 오유가 임의의 M 개의 자료비트들 혹 
은 K 개의 검사비트에서 발생하므로， 2 k -12 M + K 를 만족하여 야 한다. 이 식은 M 개 
의 자료비트들을 포함하고 있는 자료에서 한개의 비트오유를 수정 하기 위하여 요구되 
는 비트들의 수를 정한다. 표 4-3 에 여러 자료단어길이들에서 요구되는 검사비트들의 
수를 제 시하였 다. 

이 표로부터 8 개 비트로 구성된 단어는 4 개의 검사비트를 요구한다는것을 알수 
있다. 편리를 위하여 다음의 특성을 가진 4 bit 오유신드롬을 발생시키기로 하자. 


표 4-3. 오유 수정단어길 이 에서 증가 



단일오유수정 

단일오유수정/ 

2중오유검사 

자료비트수 

검사비트수 

증가률 (%) 

검사비트수 

증가률 (%) 

8 

4 

50 

5 

62.5 

16 

5 

31.25 

6 

37.5 

32 

6 

18.75 

7 

21.875 

64 

7 

10.94 

8 

12.5 

128 

8 

6.25 

9 

7.03 

256 

9 

3.52 

10 

3.91 


• 신드롬이 0을 포함한다면 오유가 없 다는것 이 다. 

• 신드롬이 1 로 설정된 비트 하나만을 포함하면 오유는 4 개의 검사비트들중의 
어 느 하나에 서 발생한 오유이 므로 수정 을 요구하지 않는다. 

• 신드롬이 1 로 설정 된 비 트가 둘이상이 라면 신드롬의 수값은 오유가 발생한 
자료비 트의 위 치를 지적한다. 이 자료비 트는 수정 을 위하여 반전된다. 

이 특성 을 얻 기 위 하여 자료와 검 사비 트들은 그림 4-10에서 보여 준바와 같이 12 bit 
단어로 배렬된다. 비트위치들을 1로부터 12까지 번호를 불인다. 위치번호가 2의 제곱 
인 비트위치들은 검사비트로서 설계되였다. 검사비트들은 다음과 같이 계산되였다. 


1 o o o 1C1 

치 치호 트트 
?|비비 
트 사 료 
비 위번 검자 




이제 비트3 이 오유로 되 였으며 0으로부터 1로 변하였다고 가정 하자. 검사비트가 
다시 계산될 때 다음의 결과가 얻어 진다. 


모든 검 사비 트들은 위 치 번호가 대 응하는 렬위 치에서 1 을 가지 는 모든 자료비 트위 
치 에 대하여 연산한다. 따라서 자료비트위 치들인 3, 5, 7, 9, 11 모두는 2 G 자리가 1 이 
며 비트위치들인 3, 6, 7, 10, 11 모두는 2 1 자리가 1 이며 비트위치 5, 6, 7, 12 는 2 2 
자리 가 1 이며 비트위 치 9, 10, 11, 12는 2 3 자러가 1 이 다. 또 하나의 방법을 고찰하면 
비트위치 간은 S i=n 인 Ci 비트들에 의 하여 검사된다. 실례로 위치 7 은 위치 4, 2, 1 
에서의 비트들에 의하여 검사된다. 즉 7 = 4 + 2 + 1. 

이 방법을 실례를 통하여 고찰하자. 8 bit 입구단어가 00111001 이라고 가정하자. 
여기서 제일 오른쪽 위치가 Ml 이다. 계산은 다음과 같다. 


새로운 검사비트들을 낡은 점사비트들과 비교할 때 신드롬단어는 다음과 같다. 
C 8 C 4 C 2 C 1 
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그림 4-11. 검사비트변경 


결과는 0110 이며 자료비트 3 을 가리키는 비트위치 6 이 오유로 나타났다는것을 지 
적 한다. 
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그림 4-11 에서는 우의 계산과정을 설명하였다. 자료와 검사비트들은 12 bit 단어로 
적합하게 배치하였다. 렬에 매 자료비트들의 위치번호를 설정함으로써 매 행에서의 1 
들이 그 행에 대한 검사비트에 의하여 검사되는 자료비트들을 가리킨다. 결과3은 1에 
의해서만 영향을 밤으므로 1 을 포함하는 렬들만 구분하기 위하여 동그라미로 표시한 
다음 검사비트들은 행별로 계산된다. 결과는 원래 자료비트들에 대해서와 오유를 포함 
하는 자료비트들에 대하여 보여 주었다. 

이 렇게 엄 어 진 부호를 단일오유수정 ( SEC ) 부호라고 한다. 일반적으로 반도체기 억 
기는 단일오유수정과 2중오유람색 ( SEC - DED ) 부호로 설치되였다. 표 4-3 이 보여 주는 
것처럼 이와 같은 부호들은 SEC 부호와의 비교에 추가적인 비트 하나를 더 요구한다. 



그림 4-12. 하밍 SEC-DEC 부호 

그림 4-12 에서는 4 bit 자료단어로 주어 졌을 때 SEC - DED 부호를 어떻게 작성 하는 
가를 보여 주었다. 순서는 두개 오유가 발생 하였을 때 (그림 4-12 n ) 검사순서는 방향 
을 잡지 못하며 (그림 4-12 a ) 세번째 오유가 발생하였을 때 문제는 어렵게 된다는것 
을 보여 준다(그림 4-12 n ). 이 문제를 극복하기 위하여 총 1 의 개수가 우수가 되도 
록 8번째 비 트로 설정 하여 추가한다. 추가된 기우성비 트는 오유를 발견한다. 

오유수정부호는 복잡성을 추구하지만 기억기의 믿음성을 높여 준다. 한비트 소편 
구성 에서는 일반적으로 SEC-DED 가 적합하다고 고찰된다. 실례로 IBM 30 xx 들을 주 
기 억기에서 64 bit 자료 매개 에 대하여 8 bit SEC-DED 를 리용한다. 따라서 주기 억기의 
크기는 실제로 사용자가 리용하는것보다 약 12%정도 더 크다. VAX 콤퓨터들은 기억기 
의 개 별적 인 32 bit 자료에 대 하여 7 bitSEC-DED 를 리용하였으며 따라서 주기억 기는 
22%정 도 더 커 진다. 현대 DRAM 들은 128 bit 자료에 대 하여 9개 의 검 사비 트를 리 용하므 
로 기 억기는 사용자가 리용하는것보다 7%정도 더 커진다. 
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제3 절. 캐쉬 


캐쉬(고속완충기억기)는 주기억기를 가장 빠른 기억기들에 가까운 속도로 보장 
하기 위하여 그리고 동시에 반도체기억기들의 값 눅은 형들로 큰 용량의 기억기를 
제공하기 위하여 리 용된다. 개 념은 그림 4-13 에 주었다. 

용량이 작고 속도가 빠른 기억기와 상대적으로 용량이 크고 속도가 뜬 기억기 
가 있다. 캐쉬는 주기억기의 부분적인 복사를 진행한다. 처리장치가 기억기의 단 
어 를 읽 으러 고 시 도할 때 그 단어 가 캐 쉬 에 있는가하는 검 사를 진행한다. 만일 있 

다면 단어는 처 리장치 에로 입구 
된다. 만일 없다면 고정된 길이 
의 단어들로 구성 된 주기억기의 
블로크가 캐쉬로 넣어 지며 그 
다음 처리장치에 입력된다. 국 
부성참조현상에 의하여 자료의 
블로크가 한번의 기 억 기 참조로 
캐쉬에 꺼내여 지면 그 블로크 
에 있는 다른 단어들은 앞으로 
참조될 가능성이 충분하다. 

그림 4-14 에는 캐쉬/주기억기체계의 구조를 보여 주었다. 주기억기는 2 n 주소 
가능한 단어들로 구성되며 모든 단어들은 유일하게 n 비트주소를 가진다. 목적달성 



그림 4-13. 캐쉬와 주기억기 


K 단어 ’ 

기) 


그림 4-14. 캐쉬 /주기억 기 구조 
캐 쉬 , i - 주기억 기 


기억기^± 



L) 
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을 위하여 이 기 억기는 매개가 K 단어로 고정된 블로크를 여 러개 가지 고 있다고 
하자. 즉 M =2 n /K 개 의 블로크를 가진 다. 캐 쉬 는 K 개 단어 단위 의 C 개 행 들로 구 
성되며 이 행의 개수는 주기억블로크의 수보다 작다 ( C < M ). 

임의의 순간에 기억기의 블로크들의 어떤 작은 묶음은 캐쉬의 행들에 상주한다. 
만일 기억기의 어떤 블로크의 단어가 읽기되였다면 그 블로크는 캐쉬의 행들중의 
어느 하나에로 전송된다. 캐쉬의 행수보다 기억기의 블로크수가 더 많으므로 개별 
적인 행들은 유일적으로，영구적으로 특정의 블로크들에 할당될수 없다. 따라서 
매 개 행 들은 특정 의 블로크가 현재 기 억 되 여 있 다는것 을 지 적하는 표식표 ( tag ) 를 
가진 다. 표식 자는 보통 주기억주소의 한 부분이 다. 

그림 4-15 에 읽 기조작을 주었 다. 처 리 장치 는 주소와 읽 으러 는 단어 의 RA 를 
내보낸다. 단어가 캐쉬에 있으면 처 리장치로 끌어 들인다. 그렇지 않다면 그 단어 
를 포함하고 있는 블로크는 캐쉬로 넣기되며 호출된 단어는 동시에 처리장치로 들 
어 간다. 그림 4-15 는 이 마지막 두 조작이 병렬로 진행된다는것을 보여 주며 현 
재 캐쉬조직의 표준인 그림 4-16 에서 보여 준 구성은 이것을 반영하고 있다. 이 
구성에서 캐쉬는 자료, 조종, 주소선들로 처리장치에 련결된다. 또한 자료와 주소 
선은 주기억 기 가 결 합되 여 있는 체 계모선에 추가된 자료와 주소완충기 들에 결 합된 
다. 캐쉬명중이 발생하면 자료와 주소완충기는 리용되지 않으며 통신은 체계모선 
을 통과하지 않고 처 리 장치 와 캐쉬사이 에서만 진행된다. 캐쉬 실패 가 발생하면 요 
구되 는 주소는 체 계모선으로 전송되 며 자료는 캐 쉬 와 주기억 기 로 자료완충기 를 통 
하여 복귀된다. 다른 구성 들에서 캐쉬는 모든 자료，주소, 조종선들에 대 하여 처 
리장치 와 주기 억 장치사이 에 물리 적 으로 삽입된다. 이 경우 캐쉬 실패 에 대 하여 캐 
쉬 리 용과 관련되 는 성 능파라메 터 들에 대 한 론의 는 부록 4-1 에 주었 다. 
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그 림 4-15. 캐 쉬 읽 기 조 

























2. 캐쉬설계의 요소 

캐쉬실체들에는 종류가 많지만 캐쉬방식을 분류하고 구별하는메 봉사하는 기본설 
계 요소들은 적 다. 표 4-4 에 기 본요소들을 제 시하였 다. 

캐쉬크기 

첫 요소로서 캐 쉬 크기는 이 미 론의 되 였 다. 비 트당 전체 평 균가격 이 주기억 기 만 러 
용할 때와 비슷함 정도로 크게 캐쉬의 크기를 정하면 된다. 최소 캐쉬크기에 대한 여 
러가지 다른 류형 들이 있다. 캐 쉬 가 
크면 캐쉬주소화에 포함되는 론리문수 
도 커진다. 결과 큰 캐쉬들은 작은 캐 
쉬들보다 속도가 약간 떠지게 되는 경 
향성을 가지며 갈은 집적회로기술로 
실 현 하고 소편과 인쇄 기판의 같은 위 
치 에 배 치 되 는 경 우도 마찬가지 이 다. 

캐쉬의 크기는 리용가능한 소편과 인 
쇄기 판면적 에 의하여 영 향을 받는다. 

부록 4-1 에 제시된바와 같이 여러 연 
구들에 서 는 1 K 와 512 K 단어 사이 의 캐 
쉬크기 가 효과적 이 라는것 을 시 사하고 
있다. 캐쉬의 성능이 작업부하의 내용 
에 아주 민감하므로 하나의 적당한 캐 
쉬의 크기로 하는것은 불합리하다. 


표 4-4. 캐쉬 설계 의 요소 


캐쉬크기 

쓰기방법 

배치기능 

동시 쓰기 

직접 

비 동시 쓰기 

완전 련상 

한번 쓰기 

묶음련상 

행크기 

치환알고리듬 

캐쉬수 

LRU 

단일 혹은 2 준위 

FIFO 

동일 혹은 분할 

LFU 


자유 



배치기능 

주기억기의 블로크수보다 캐쉬행들은 더 작으므로 캐쉬행 에 주기억블로크들을 배 
치 하기 위한 알고리 듬이 요구된 다. 앞으로 이 방법 들은 주기억 블로크가 현재 캐 쉬 행 에 
있는가를 검사하는데 요구된다. 배치기능의 선택은 캐쉬가 어떻게 구성되였는가에 달 
려 있다. 직접배치, 완전련상배치, 묶음련상배치와 갈은 세가지 기술이 리용될수 있다. 
이 동작원리들에 대하여 설명하자. 매 경우에 일반적인 구조와 주어 진 실례를 고찰한 

다.세 가지 경 우들에 대 하여 실 
례는 다음의 요소들을 포함한 
다. 

• 캐쉬는 64 KB 를 가진 
체 다. 

계 

2 • 자료는 주기억 기 와 캐 

선 쉬 사 이 에 서 4 byte 의 

블로크로 전송된다. 
이것은 캐 쉬가 
16 K =2 14 개 의 4 byte 행 


처리장치 

주소 1기 




□ 

주 소 

오 h 히 1 

，조종 [ 

캐 쉬 

조 종 






I4fi 

자 료 !. r - 


그림 4-16. 일반적캐쉬조직 


들로 구성되였다는것 
을 의 미한다. 
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캐쉬행 

배치된 주기억 볼로크 

0 

0， m , 2 m , … , 2 s ~m 

1 

1, m + l , 2 m + l , …， 2 s - m+l 



m~l 

m - l ,2 ffl - l ,3 m - l , … ,2 S -1 


따라서 행번호로서 주소부분의 리용은 캐쉬에 주기억기의 개별적인 블로크에 대한 
유일한 배치를 계공한다. 블로크가 실제적으로 배치된 행에서 읽어 질 때 그 행에 대 
응하는 다른 블로크들로부터 구별하기 위한 자료를 덧붙이는것 이 필요하다. 가장 웃 
부분의 s - r 개 비트들은 이러한 목적에 리용된다. 

그림 4-18 에서 는 직 접 배 치방식 을 리용한 실례 를 보여 주었 다. 실례 에서 
m =16 K =2 14 , 그리고 i = j modulo 2 14 이 다. 배치는 다음과 같이 된다. 


캐쉬 행 

볼로크의 시작 기억주소 

0 

000000,010000, … 

, FF 0000 

1 

000004,010004, … 

, FF 0004 


n 

m~l 

00 FFFC , 1 FFFC , 

…， FFFFFC 


갈은 행번호로 배치되는 2 개의 블로크가 갈은 표식자번호를 가지는 경우는 없다. 
따라서 블로크 000000,010000, FF 0000 는 각각 표식 표번호 00,01 ，".FF 을 가진다. 

그림 4-15 를 다시 고찰하면 읽기조작은 다음과 같이 진행된다. 캐쉬체계는 24 bit 
주소로 존재한다. 14 bit 행 번호는 캐쉬 에서 특정의 행 을 호출하기 위한 첨수로 리 용된 
다. 만일 8 bit 표식자번호가 현재 그 행에 기억된 표식표번호와 같다면 2 bit 단어번호 
가 지적된 행에서 4 byte 중의 하나를 선택하는데 리용된다. 같지 않다면 22 bit 표식자 
와 행 번호마당은 주기억기 로부터 블로크를 꺼 내는데 리 용된다. 꺼 내기 에 리용되는 실 
제주소는 4 byte 가 블로크경계의 시작부터 꺼내여 지도록 22 bit 표식표와 행번호마당에 
단어 마당 두비 트를 0으로 하여 결 합한다. 

직접배치기술은 실현하기 간단하며 비용도 적게 든다. 기본결함은 임의의 주어 진 
블로크에 대한 캐쉬의 위치가 고정된것이다. 따라서 프로그람이 같은 행에 배치되는 
두개의 서로 다른 블로크들로부터 반복적 으로 단어들을 참조하게 되 였다면 이때 블로 
크들을 련속적으로 캐쉬에 번갈아 넣기되며 명중률이 낮아 진다. 

련상배 치 방식 은 주기 억 블로크들이 캐 쉬 의 임 의 의 행 에 넣 기 되 도록 허 락함으로써 직 접 
배치의 결함을 극복한 방식이다. 이 경우에 캐쉬조종론리는 표식자와 단어마당으로서 기억 
기주소를 간단히 갈라서 해석한다. 표식자마당은 유일하게 주기억기의 블로크를 지적한다. 
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표식자 자료 


foooo 

V0004 

13579246 - 

00-/ - 

, 广 - 

IFFF8 

^FFFC 


ijjCooo 

10004- 

77777777 

J 1235813 

16 + 9C J 

FEDCBA 淡 - 

(fffc 

12345678 

「0000 

10004 


] ^ 

/ 卵 F8 

Ifffc 

11223344 

24682468 


16Mbyte 주기억기 




표식자 행 단어 

주기억기주소 = | 8 | 14 |21 


그림 4-18. 직접배치실례 

블로크가 캐쉬에 있는가 없는가를 확정하기 위하여 캐쉬조종론리는 련속적으로 모든 행들 
의 표식 자를 검 사하여 야 한다. 그림 4-19 에 이 조종론리 를 주었 다. 

그림 4-20 은 련상배 치 방식 을 리 용한 실 례 이 다. 주기 억 기 주소는 22 bit 표식 자와 
2 bit 바이트번호로 구성된다. 22 bit 표식자는 캐쉬에서 매개 행에 대응하는 자료의 
32 bit 블로크를 지적 하여 야 한다. 주소의 제 일 왼쪽 22 bit 는 표식 자를 형성 한다. 따라 
서 24 bitl 6 진수 주소 16339 C 는 22 bit 표식자 058 CE 7 을 가진다. 이것은 쉽게 2진수표 
시법 으로 볼수 있 다. 


주기억 기 주소 0001 0110 0011 0011 1001 1100 (2 진수) 

1 6 3 3 9 C (16 진수) 

표 식 표 00 0101 1000 1100 1110 0111 (2 진수) 
0 5 8 C E 7 (16 진수) 
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그림 4-19. 완전 * 


련상배 치 방식 에 서 는 새 로운 블로크가 캐 쉬 로 읽 기 될 때 임 의 의 블로크를 치 환힐 
으므로 유연하다. 이 절의 뒤에서 론의하는 치환알고리듬들은 명중률을 최대로 히 
설계되였다. 련상배치방식의 기본결함은 모든 캐쉬행들의 표식자를 병렬로 조시 
위한 복잡한 회 로를 가지 는것 이 다. 

묶음련상배 치방식은 직접배 치와 완전련상배 치방법들의 우점을 살리는 한편 이 
식의 결함을 감소시 킨 방식 이 다. 이 경우에 캐쉬는 요 개의 행들로 구성되는 v 개 
음들로 분할된다. 관계식은 다음과 갈다. 


m = v 
i = j m 

여기서 / •-캐쉬묶음번 J 

j - 주기억블로£ 
m - 캐 쉬의 행여 

이것을 요 통로 묶음련상배 치 방식 이 라 J 
옴의 임의의 행들에 배치될수 있다. 이 
음，단어 이렇게 단순히 3 개의 마당으 i 
음중의 하나를 지적한다. s 개의 표식 자 
크중 하나를 지적한다. 그림 4-21 에서나 


블로크 퍼는 i 적 
억기주소를 표식 
트들은 v =2 d 개 
녀억의 2 s 개의 
j 다. 완전련상배 







16Mbyte 주기 억 


_ 표식자 _ 

주기억기주소 = | 22 |2 || 

그림 4-20. 련상배 치실례 

며 한개의 묶음안에 있는 if 개의 표식자들에 대해서만 비교하면 된다. 

그림 4-22 에서는 2 통로 묶음련상이 라고 할수 있는 묶음당 2 개의 행으로 된 묶음 
련상배 치방식 을 리 용한 실례 를 보여 주었다. 13 bit 묶음번호는 캐쉬안에서 두개의 행를 
로 된 한개의 묶음을 지적 한다. 또한 주기 억기의 블로크번호를 2 13 으로 나눈 나머지 가 
주어 진다. 이 나머지는 행 들에 블로크들의 배 치를 결정한다. 즉 주기억기의 블로크들 
인 00000, 00 A 000, …， FF 1000 는 캐 쉬 묶음 0 에 배 치 된 다. 임 의 의 이 블로크들은 묶음에 
서 두개의 행들중 임의의 위치에 넣기될수 있다. 

갈은 캐쉬묶음에 배치된 두개의 블로크는 같은 표식자번호를 가지지 않는다는것에 
주목해 야 한다. 읽 기 조작에 서 13 bit 묶음번호는 어 느 묶음이 조사되 는가를 결 정하는데 
리용된다. 묶음의 두개 행들은 호출되는 주소의 표식자번호와 맞는가를 위하여 조사된다. 

v = m , k =1 인 경우에 묶음련상배치방식은 직접배치방식으로 되며 v = l , 쇼 =m 인 
경우에는 완전련상배치방식으로 된다. 묶음당 두 행 ( v = m /2, k = 2) 방식의 리용은 가 
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다. FIF ◦ 는 순환대 기 렬 완충기기 술로서 쉽 게 실현한다. 또 하나의 가능성 은 LFU 방식 
이 다. 이 방식은 가장 적은 참조를 예 측하여 선정된 묶음의 블로크를 치 환한다. LFU 는 
매 행에 계수기를 련상시킬 때에 실현할수 있다. 사용량에 기초하지 않는 기술은 후보 
행 들중에서 우연히 한행 을 포착하는것 이 다. 모의 학습들은 자유치 환이 습관상 기 준으로 
되는 알고리듬에 약간 뒤떨어 진 성능을 제공한다는것을 보여 준다. 


표식 자 묶음+단어 자료 



32 bit 표식자 

16 Mbyte 기 본기억 기 주소= :| 9 ~ 

주기 억 기 1 - 


그림 4-22. 두통로묶음련상배 치실례 


쓰기 방책 

캐 쉬 에 들어 있는 블로크를 치 환하기 전에 그 블로크가 캐쉬안에 서 변하였지 만 대 
응하는 주기억에는 그렇지 못할수 있다는것을 고찰할 필요가 있다. 만일 주기억블로크 
가 변하지 않았다면 캐쉬 에 있는 낡은 블로크를 주기억 에 대 하여 쓰기를 진행하여 야 
한다. 만일 주기억블로크가 변하였다면 적어도 한번의 쓰기조작이 캐쉬의 주어 진 행 
의 단어 에 대 하여 수행 되 며 이 때 주기억 기 도 같이 갱 신되 는 방법 을 리용한것 이 다. 성 
능과 실용적 인 상품화지표들에 따라 여 러 가지 쓰기방법 들이 가능하다. 경 쟁상 두가지 
문제 가 있 다. 첫째 로는 하나이상의 장치 들이 주기억 기 에 대 한 호출을 진행하는것 이 다. 
실례로 I/O 장치가 기억기에 직접 읽기/쓰기할수 있다. 어떤 단어가 캐쉬에서만 변하 
였다면 이때 대응하는 기억기 단어는 무효로 된다. I 八)장치가 주기 억기를 변경시켰다면 
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이때 캐쉬단어가 무효로 된다. 여러개의 처리장치들이 같은 모선에 결합되고 매 처리 
장치들이 자기의 국부캐쉬를 가질 때 더 복잡한 문제들이 발생한다. 이때 어떤 단어가 
캐쉬에서 변하였다면 다른 캐쉬들에 있는 단어들은 무효화될수 있다. 

가장 간단한 기술은 동시쓰기 방식 이 다. 이 기술을 리용하면 모든 쓰기조작은 캐쉬 
와 동시에 주기억기에 대하여 진행되며 주기억기가 항상 유효하게 보존된다. 어떤 다 
른 처리장치- 캐쉬장치는 그 캐쉬안에서 일치성을 유지하도록 주기억에 대한 입출력관 
계를 감시할수 있다. 이 기술의 기본결함은 실제적인 기억기입출력관계가 발생하므로 
병목현상(성능제 한현상)이 발생 한다는것 이 다. 비동시쓰기 방식 이 라고 하는 또 하나의 
기술은 기억기쓰기를 최소로 하게 한다. 비동시쓰기에서는 캐쉬에 대해서만 갱신을 진 
행한다. 갱 신조작이 일 어 나면 행 과 관련된 UPDATE 비 트가 설정된다. 그다음 블로 
크가 치환될 때 UPDATE 비 트가 설정되 여 있으면 해 당 주기억기위치 가 무효화되 였다 
는것 이며 결국 I/O 장치 에 의한 호출은 캐쉬를 통해서 만 진행될수 있다. 이것은 복잡 
한 회 로구성과 병목현상을 초래한다. 경험은 쓰기조작에 의한 기 억기호출비률이 15%정 
도라는것을 보여 준다. 

캐쉬와 공유기억기를 가진 하나이상의 장치 (대 표적 으로 처 리 장치)를 가진 모선구 
성에서 새로운 문제점들이 나타난다. 어떤 하나의 캐쉬에서 자료가 변하면 이것은 주 
기억기의 대응하는 단어뿐아니라 다른 캐쉬와 같은 단어도 무효화한다(만일 어떤 다른 
캐 쉬 가 같은 단어 를 가지 는 경 우가 발생 한다면) . 만일 동시 쓰기방법 이 리용되 였 다면 
다른 캐쉬는 무효자료를 포함한다. 이 문제를 방지하는 체계는 캐쉬의 일치성을 유지 
한다고 말한다. 캐 쉬일 치 성 을 위한 가능한 방법 들은 다음과 갈다. 

• 동시쓰기감시모선방법 : 매개의 캐쉬조종기들은 다른 모선조종기들에 의한 기 
억 기 쓰기 조작을 검 사하기 위하여 주소모선을 감시한다. 만일 다른 조종장치 가 
캐쉬기억기에 들어 와 있는 공유기억기위치에 대 한 쓰기를 진행 하였다면 캐쉬 
조종기는 캐쉬의 해당한 부분을 무효화한다. 이 방법은 모든 캐쉬조종장치들 
에 대한 동시쓰기방법의 리용에 의존한다. 

• 장치적전면복사방식 : 캐쉬를 통한 주기억기의 모든 갱 신이 모든 캐쉬들에 복 
사하게 하는것을 담보하는 추가적 인 장치 가 리용된다. 따라서 어떤 처 리장치 
가 자기 캐쉬의 단어를 변경시 켰다면 이 갱 신은 주기억기에 써지며 동시에 다 
른 캐쉬들에서 대응되는 단어들도 같이 갱신된다. 

• 무캐쉬기억기방식 : 주기억기의 일부분만이 하나이상의 처리 장치들에 공유되며 
이 부분은 캐쉬가 없이 설계되였다. 이와 갈은 체계에서 공유기억기의 모든 
호출은 공유기억 기 가 캐 쉬 에 로 복사되 지 않으므로 캐 쉬 실패 를 가진다. 무캐 쉬 
기 억 기는 소편선택 론리 나 높은 주소비트들을 리 용하여 지적할수 있다. 

캐쉬일치성은 활성화된 연구분야이 다. 이 문제는 제 16 장에서 더 전개한다. 

행크기 

또 하나의 설계요소는 행의 크기이다. 자료의 블로크가 캐쉬에 들어 와 배치될 때 
요구되는 단어 뿐 만아니 라 린접한 몇 개의 단어들로 입 력된다. 블로크크기 가 매우 작은 
것으로부터 증가하면 초기에는 참조된 자료의 근방에 있는 자료들윳 가까운 시기에 다 
시 참조될수 있다는 국부성의 법칙에 의하여 캐쉬명중률이 증가한다. 계속 블로크의 
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크기가 증가하면 더 효률적 인 자료가 캐쉬에로 들어 오게 된다. 그러나 블로크가 너무 
커지면 새롭게 꺼내여 진 정보의 리용부분은 치환되는 정보의 재리용부분보다 적어 지 
므로 캐쉬명중률은 감소된다. 따라서 두가지 특수영향을 받는다. 

• 큰 블로크는 캐쉬 에 넣 어 지는 블로크들의 수를 적게 한다. 매 개 블로크꺼 내 
기는 낡은 캐쉬 내용들을 겹 쳐쓰기 하므로 적은 수의 블로크들은 블로크꺼 내기 
후에 즉시로 자료들이 재쓰기되는 결과를 나타낸다. 

• 블로크가 더 커지면 블로크내의 다른 단어들은 요구되는 단어로부터 더 멀리 
있게 되며 따라서 가까운 시 간내 에 참조될 가능성 이 적게 된다. 

블로크크기 와 명 중률사이의 관계 는 개 별적 프로그람들의 국부성의 특성 들에 의 존하 
고 또한 결정적인 최량값을 찾을수 없으므로 복잡하다. 

2 개로부터 8 개 단어까지 크기에 대하여서는 적 당하게 최 량값이 있을수 있다 
[ SMIT 87 a , PRZY 88, PRZY 90, HAND 98]. 


캐쉬의 수 

캐쉬 들이 원리 적 으로 소개 될 때 표준체 계 는 단일 캐쉬 를 가진다. 최 근에 다중 
캐 쉬 의 리 용 이 일 반적 이 다. 이 설 계 지 표의 두가지 형 태 로는 여 러 준위 캐 쉬 방식 과 
동일 준위분할 캐 쉬 리용방식 이 있 다. 

론리밀도가 증가함에 따라 처 리 장치 와 같은 소편에 캐쉬를 설치할수 있는 가능 
성이 생기게 된다. 외부모선을 통해서 도달할수 있는 캐쉬에 비하여 같은 소편우 
에 있는 캐쉬는 처리기의 외부모선활성을 감소시키므로 집행속도가 빨라 지게 하 
고 체계의 전체적인 성능을 높인다. 요구하는 명령이나 자료를 내부캐쉬에서 찾을 
때 모선호출은 없어 진다. 처 리장치안의 자료통로는 외부모선길이보다 비교적 짧 
으므로 내 부캐쉬 를 기 다림상태 가 없는 모선주기 보다 현저하게 빨리 완성 된다. 이 
기 간동안 모선은 다른 전송을 제 공하기 위한 자유상태 에 있 게 된다. 내 부캐쉬 의 
출현은 소편밖의 외부캐쉬가 여전히 있어야 하는가하는 질문을 가지게 한다. 대답 
은있어야 한다는것이며 대부분 현대설계는 내부캐쉬와 외부캐쉬를 다 포함한다. 
결과 이 구성을 2 준위캐쉬라고 하고 있다. 여기서 내부캐쉬는 Ll(l 준위)，외부캐 
쉬 는 L 2(2 준위 ) 이 라고 한다. L 2 준위캐 쉬 를 포함하게 되 는 리유는 다음과 같다. L 2 
캐 쉬 가 없 다면 처 리 장치 는 L 1 준위 에 서 는 할수 없 는 주기 억 기 에 대 한 호출요구를 
가지게 된다. 이때 처 리 장치 는 모선을 통하여 DRAM 혹은 ROM 기 억기를 호출하 
여 야 한다. 그러 면 속도가 뜬 모선과 기 억 기호출속도로 인하여 낮은 성 능을 초래 
하게 된 다. 다른 한편 L 2 SRAM 캐 쉬 가 리 용된 다면 자주 발생 하는 캐 쉬 실 패 정 보 
가 빨리 전송된다. SRAM 이 모선속도에 비하여 충분히 빠르다면 자료는 모선전송 
의 가장 빠른 형태인 기다림상태 없는 동작으로 호출될수 있다. 

L 2 캐쉬의 리용에 의한 가능한 보관은 L 1 와 L 2 캐쉬 에서 명 중률에 의 존한다. 
여 러 가지 연구들은 일반적 으로 두번째 준위캐쉬의 리용이 성능을 개선한다는것 을 
보여 준다. 

내 부캐 쉬 가 처 음으로 출현 하였 을 때 대 부분 설 계 들은 자료와 명 령 을 함께 기 억 
하는 단일캐쉬구성방식을 리용하였다. 최근에 이 캐쉬는 두개로 즉 명령을 기억하 
는 캐 쉬 와 자료를 기 억하는 캐 쉬 로 가르는것 이 일 반적 인것 으로 되 였 다. 
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단일캐쉬 방식은 다음의 여 러가지 우점을 가진다. 

• 주어 진 캐쉬크기에 대하여 단일캐쉬는 명령과 자료사이의 부하가 자동적 
으로 조절되므로 분할캐쉬방식보다 명중률이 높다. 즉 집행패턴이 재료꺼 
내기보다 더 많이 명령꺼내기를 진행하였다면 이때 캐쉬는 명령들로 가득 
차게 되며 집행패런이 반대로 자료꺼내기를 많이 진행하였다면 반대현상이 
나 타난다. 

• 하나의 캐쉬에 대해서만 설계하고 제작하면 된다. 

이 우점을 무시하고 추세는 특별히 병렬명령집행과 예측된 선행명령들의 미리 
꺼 내기를 강화한 Pentium II 와 PowerPC 와 같은 고속스칼라처 리장치들에 쓰이는 
분할캐 쉬 방향이 다. 분할캐 쉬 설계 의 기 본우점 은 이 방식 이 명 령 처 리 장치 와 집 행 장치 
사이에 캐쉬에 대한 경쟁을 없앤다는것이다. 이 방식은 명령의 관흐름조종에 기대 
를 거는 설계들에서 중요하다. 일반적으로 처리장치는 선행적으로 명령들을 미리 
꺼내여 완충기에 채워 넣으며 관흐름형식으로 처리한다. 이제 단일화된 명령/자료 
캐쉬를 가졌다고 가정하자. 집행장치가 자료를 꺼내고 기억하는 기억기호출을 진 
행할 때 호출요구는 단일캐쉬에 복종된다. 만일 동시에 명령미리꺼내기장치가 명 
령을 위하여 캐쉬 에 읽기요구를 하였다면 이 요구는 현재 집 행 하고 있는 명 령을 
완성할수 있게 먼저 집행장치를 봉사하도록 봉쇄된다. 이 캐쉬경쟁은 명령관흐름 
조종방식 의 효률 높은 리용에 간섭 함으로써 성 능을 떨 어 지 게 할수 있 다. 분할캐 
쉬 구조는 이 결 함을 해 결 하였 다. 

제 4 절 . Pentium II 와 PowerPC 캐쉬조직 

l. Pentium II캐쉬의 조직 

캐쉬조직의 발전을 인텔의 극소형처리장치의 발전에서 명백히 찾아 보자.80386 
은 내 부캐쉬 를 포함하지 못하였 다. 80486은 행 의 크기 가 16 byte 이 고 4통로묶음련 
상방식 으로 된 8 Kbyte 의 단일 내 부캐 쉬 를 포함하였 다. Pentium Pro 와 Pentium II 
도 2 개 의 L 1 내 부캐쉬 를 포함하였 다. 처 리 장치 의 초기변종들은 8 Kbyte 의 4 통로묶 
음련상명 령캐쉬와 8 Kbyte 의 2통로묶음련상자료캐쉬 를 포함하였 다. Pentium Pro 
와 Pentium II 는 L 1 캐 쉬 들을 가지 는 L 2 캐 쉬 도 포함하였 다. L 2 캐 쉬 는 256 KB , 
1 MB 사이 의 크기 를 가지 는 4통로묶음련상방식 이 다. 

그림 4-23 에서는 3개의 캐쉬들의 배치가 명백한 Pentium II 조직에 대하여 간단히 
보여 주었다. 처 리장치는 기본적으로 4개의 기본구성부분들로 구성되 였다. 

• 꺼 내 기/해 신장치 : L 1 명 령 캐 쉬 로부터 순서 대 로 프로그람명 령들을 꺼 내 며 마 
이 크로연산들의 렬 로 명 령 들을 해 신하고 해 신된 명 령 기 다림렬 에 해 신결과를 
기 억 한다. 

• 해 신된 명 령 기 다림 렬 : 집 행 가능한 해 신된 명 령 들의 묶음을 보관한다. 

• 선택/집 행장치 : 자료의존성 과 자원리용가능성 에 종속되 는 마이 크로연산들의 
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그림 4-24. Pentium 1 1 자료캐 쉬의 주소 


자료캐쉬의 일치성 

캐쉬의 일 치성 을 보장하기 위하여 자료캐쉬 는 MESI 라는 규약을 지 원하고 있 
다. MESI ( modified / exclusive / shared / invalid ) 는 다중 처 리 장치 체 계 에 서 캐 쉬의 
일 치 성 요구들을 지 원하기 위 하여 설계 되 였 다. 그러 나 단일 처 리 장치 Pentium II 조직 
에서도 효과적 이 다. 

자료캐쉬는 표식자마다 2 개의 상태비트들을 가지며 따라서 매행은 4 개상태중의 
하나로 될수 있다. 

• 변경상태 : 캐쉬의 행이 변경되였을 때(주기억기와 다르다.) 이 캐쉬만 리 
용할수 있다. 

• 독점 상태 : 캐 쉬 의 행 이 주기억 기 와 내 용이 갈으며 다른 캐 쉬 에 는 존재하지 
못한다. 

• 공유상태 : 캐쉬의 행 이 주기 억 기와 갈으며 다른 캐쉬 에 존재 한다. 

• 무효화상태: 캐쉬의 행이 유효자료를 가지고 있지 못한다. 

표 4-5 에 4가지 상태들의 의 미를 개괄하였다. MESI 규약은 계 16장에서 상세 
히 론의한다. 
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표 4-5. MESI 캐 쉬 행상래 



변경 

E 

독점 

S 

공유 

1 

무효 

캐쉬행은 유효인가? 

유효 

유효 

유효 

무효 

기억 기복사 

자료넘 침 

유효 

유효 

- 

다른 캐쉬에서 복사존재 

불가능 

불가% 

가능 

가능 

행에 대한 쓰기 

모선으로 
못감 

모선으로 
못감 

으로 가 
서 캐쉬갱신 

모선으로 
직접 감 


캐쉬조종 

내 부캐 쉬 는 CD (cache disable ) 과 NW(not write - through ) 로 표기 된 조종등록기 
들중의 하나에서 2 개의 비트들에 의하여 조종된다(표 4-6). 또한 캐쉬조종에 리용되 
는 2개의 Pentium II 명령 이 있다. INVD 는 내부캐쉬를 무효로 되게 하며 외부기억기 
를 무효로 하기 위한 신호를 보낸다. 외부캐쉬를 비동시쓰기로 하며 무효화한다. 


표 4-6. Pentium II 캐쉬조작방식 


조종비트 

조작방식 

CD 

NW 

캐 쉬 

동시쓰기 

무효화 

0 

0 

가능 

가능 

가능 

1 

0 

불가놓 

가눙 


1 

1 

불가능 

불가능 

불가능 

주의: CE - 

0 ；NW = 

= 1 은 무효화된 

조합 



2 . PowerPC 캐쉬의 조직 

PowerPC 캐 쉬 조직 은 모든 극소형 처 리 장치 설 계 자들이 힘 을 집 중하고 있는 성 능제 
고를 반영 한 PowerPC 계 렬의 전반적 인 기 본방식 으로 개선되 였다. 


A 4-7. PowerPC 내ᅭ^ HI 


표준 

크기 

바이트/행 

조직 

PowerPC 601 

132 kbyte 

32 

8 통로묶음련상 

PowerPC 601 

28 kbyte 

32 

2통로묶음련상 

PowerPC 601 

216 kbyte 

32 

4통로묶음련상 

PowerPC 601 

232 byte 

64 

8통로묶음련상 


표 4-7 에는 이 개선과정을 보여 주었다. 기본형 6()1 은 8통로묶음련상인 32 Kbyte 
의 단일부호/자료캐쉬를 가지고 있다. 603은 더 강한 RISC 설계를 실현하였지만 더 작 
은 캐쉬를 가지고 있다. 즉 두 통로묶음련상방식의 구성을 리용하였으며 개별적인 명 
령과 자료캐쉬로 분할된 16 KB 크기로 되여 있다. 결과는 더 눅은 가격으로서 601 과 
비슷한 성능을 가진다는것이다. 604와 620은 매개가 선행한 형에서의 캐쉬크기를 두배 
로 하였 다. 현재 G 3 형 은 620과 같은 L 1 캐 쉬 크기 를 가진 다. 

그림 4-25 에서는 두개의 캐쉬배 치를 가진 PowerPC G 3 형의 블로크도를 보여 주 
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었다. 계렬의 다른 번호들의 구성도 비슷하다. 기본집행장치는 병렬집행가능한 두개의 
옹근수 산수-론리 연산장치 와 류점 수전용등록기 들과 전용곱하기，더 하기，나누기 연산구 
성요소들로 되 여 있는 류점수연산장치들로 되 여 있다. 자료캐쉬는 load/store 장치를 
통하여 옹근수와 류점 수연산들에 연산수를 제 공한다. 읽 기전용명 령캐쉬는 명 령 장치 에 
명 령을 제공한다. 연산에 대해서는 제 13장에서 론의 한다. 

L 1 캐쉬는 8통로 묶음련상방식 이며 MESI 캐쉬일치성규약의 변종을 러용한다. 

L 2 캐 쉬 는 256 K , 512 K , 1 MB 기 억 기 로서 2통로묶음련상캐 쉬 이 다. 



그림 4-25. PowerPC G3 형 블 로크도 


제 5절. 현대적인 DRAM 조직 

제 2 장에서 론의한것처 럼 고성능처 리장치들을 러용할 때 가장 방해로 되는 체계의 
하나는 기본내부기 억기에 대한 결합방법 이 다. 이 결합방법은 전반적 인 콤퓨터체계 에서 
가장 중요한 방법 이 다. 주기억기의 블로크를 구성하는 기초는 이미 1970 년대부터 
DRAM 방식 에서 기본적 인 변화가 없으며 현재까지 20년이상 리 용하고 있는 DRAM 소 
편이다. 전통적 인 DRAM 소편은 그의 내부방식과 처리장치의 기 억기모선에 대한 결합 
방식에 제한되였다. 

DRAM 주기 억 기 의 성 능문제 를 해 결 하는 방법 의 하나가 DRAM 주기 억 기 와 처 리 장 
치사이 에 하나이상의 고속 SRAM 캐쉬를 삽입하는것 이 라는것을 보았다. 그러 나 SRAM 


115 






















은 DRAM 보다 비용이 많이 들므로 이 점을 고려하지 않고 캐쉬용량을 확장하는것은 
필요 없는 일이다. 

몇년 지나서 기 본 DRAM 방식 을 보강한것 들이 소개 되 였 으며 그 일 부는 지 금 시 장 
에서 판매되고 있다. 이 문제에서 하나의 표준적인 DRAM 으로서 출현하겠는가 아니 
면 여러가지가 다 존재하겠는가 하는것은 명백치 않다. 이 절에서는 이 새로운 
DRAM 기 술에 대 하여 고찰한다. 

1. 개선된 DRAM 

대체 로 가장 단순한 새로운 DRAM 방식은 램트론에 의하여 개 발된 EDRAM 이 다. 
EDRAM 은 일반적인 DRAM 소편에 적은 SRAM 캐쉬를 집적화하였다. 그림 4-26 은 
EDRAM 의 4 Mbit 변종을 소개 하였다. SRAM 캐쉬는 2048 bit 혹은 512 X 4 bit 묶음으로 
구성된 마지막으로 읽는 행의 전체 내 용을 기 억한다. 비교기는 가장 최근의 행주소선 



택의 libit 값을 기 억 한다. 다음호출이 같은 행 이 라면 그때 호출요구는 고속 SRAM 캐 
쉬 에 대 해서 만 진행한다. 

EDRAM 은 성능을 높이기 위한 여 러 가지 다른 특성들을 포함한다. 재생조작은 소편 
이 재생에 리용할수 없는 시간을 최소로 하면서 캐쉬읽기조작과 병렬로 진행할수 있다. 

또한 행캐쉬 로부터 출력포구까지의 읽기경로가 I/O 장치 로부터 쓰기증폭기까지의 
쓰기경로와 독립적이다. 이것은 쓰기조작의 완성과 병렬로 만족되게 캐쉬에 대한 련속 
적인 읽기호출을 가능하게 한다. 

램트론에 의하여 작성된 연구론문들은 EDRAM 이 외부에 더 큰 SRAM 캐쉬를 가 
진 기 본 DRAM 보다 더 좋거 나 그와 비 슷하게 수행 한다는것 을 지 적 한다. 
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2. 캐쉬 DRAM 

미 프비 시 에 의 하여 개 발된 캐 쉬 DRAM ( CDRAM ) 은 EDRAM 과 비 슷하다. DRAM 
은 EDRAM 보다 더 큰 SRAM 캐 쉬 (16 〜 2 KB ) 를 포함한다. 

CDRAM 에서의 SRAM 은 2개의 통로로 리용할수 있다. 첫째로 여러개의 64 bit 행 
들로 구성된 실지 캐쉬로 리용될수 있다. 이것이 SRAM 캐쉬가 한개의 블로크 다시말 
하여 가장 최근에 호출된 행만으로 되여 있는 EDRAM 과 대조적 인것 이 다. CDRAM 의 
캐 쉬방식 은 보통 기 억 기 에 대 한 자유호출에 대 하여 효과적 이 다. 

CDRAM 에서 SRAM 은 자료블로크의 련속적 인 호출을 지 원하는 완충기 로서 리 용 
될수도 있다. 실례 로 비트매 프형 표시 장치들을 재생 하기 위하여 CDRAM 은 DRAM 으 
로부터 SRAM 완충기 에 로 자료를 미 리 꺼 내기할수 있다. 소편에 대 한 련속적 인 호출 
들은 단지 SRAM 에 대 한 호출로 된다. 

3. 동기식 DRAM 

DRAM 성 능을 개 선하기 위한 완전히 다른 방법 이 여 러 회 사들에 서 협 동개 발된 동 
기 식 DRAM ( SDRAM ) 이 다 . 

비 동기 식 인 표준 DRAM 과 달리 SDRAM 은 외 부박자신호에 등기 된 처 리 장치 와 
함께 자료를 교환하면 기 다림상태 가 없 이 처 리 장치 /기 억기 모선의 충분한 속도로 
집행된다. 

표준 DRAM 에서 처 리 장치 는 주기억기의 개 별적주소에서 자료묶음이 DRAM 에 
대 하여 읽 기 혹은 쓰기 를 진행할수 있 다는것 을 가리키 는 주소와 조종신호들을 가 
진다. 호출시 간과 같은 일정 한 지 연후에 DRAM 은 자료에 대 한 읽기 혹은 쓰기를 
진행한다. 호출시 간지연동안 DRAM 은 행 과 렬의 축전기 들의 용량을 높게 하며 자 
료를 받아 들이고 출력완충기 를 통하여 출력자료를 발송하는것 과 갈은 여 러 가지 
내 부기 능들을 수행한다. 처 리 장치 는 이 지 연으로 약간 기다려야 하며 이 것 으로 체 
계 성능은 떨 어 진 다. 

동기식 에서 DRAM 은 체 계박자의 조종에 의하여 입 출력자료를 전송한다. 처 리 
장치 나 다른 조종장치들은 DRAM 에 의하여 빗장되는 명 령과 주소정보를 전송한다. 
이때 DRAM 은 여 러개의 박자주기 를 지 나서 응답한다. 한편 조종장치는 SDRAM 
이 이 요구를 처 리 하고 있는 동안에 다른 과제 를 수행할수 있다. 

그림 4-27 에서 는 SDRAM 의 내부론리 를 보여 주었 다. SDRAM 은 첫 호출후에 
는 주소설정시간과 행과 렬로 선택된 자료를 먼저 충전하는 시간을 없애는 버스트 
방식을 채용하였다. 버스트방식에서 자료비트들의 련속적인 렬은 첫 비트가 호출 
된 후에 빠르게 박자에 동기되 여 출구될 수 있다. 이 방식 은 호출되 는 모든 비 트들 
이 련속적으로 되여 있으며 처음의 호출과 배렬이 갈은 행에 있을 때 효과적이다. 

더우기 SDRAM 은 소편내의 병 렬화에 대 하여 좋은 기회 를 주는 2 중묶음내부 
방식 을 가지 고 있다. 

방식등록기와 련관된 조종론리는 전통적 인 DRAM 으로부터 SDRAM 들을 구별하는 
또 하나의 기 본특징 이 다. 이 것 들은 특별 한 체 계 요구들을 만족하도록 SDRAM 을 요구대 로 
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변경 시 킬수 있 는 기 구를 계 공한다 
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접수와 자료전송의 시작사이의 지< 
SDRAM 은 단어 처 리，표계 
큰 자료블로크를 전송할 때 가; 











의 RDRAM 소편들에 대하여 주소화할수 있으며 500 Mbps 정도의 속도를 가진다. 
이것은 비동기 DRAM 들에서 33 Mbps 에 대 략적으로 비 교한것 이 다. 

전용 RDRAM 모선은 비 동기 적 인 블로크지향통신규약을 리용하는 주소와 조종 
정 보를 접 수한다. 초기 480 ns 호출시 간후에 500 Mbps 자료속도를 생 성 한다. 이 속도 
를 가능하게 하는것은 전압전류비, 박자화, 아주 정확한 신호들로 규정되는 모선 
그자체에 있다. 전통적인 DRAM 들에서 리용되는 명백한 RAS , CAS , R / W , CE 
신호들에 의하여 조종되 기 보다 RDRAM 은 고속모선으로부터 기 억기요구를 얻는다. 
이 요구는 호출하려는 주소，조작의 형태，조작에 참가하는 바이트수를 포함한다. 

5. 램련결 

전 통적 인 DRAM 으 로부 터 가장 기 본적 인 변 화는 SCI (Scalable Coherent 
Interface ) 라고 하는 IEEE 연구그루빠가 하나의 성 과로서 개 발한 램 련결 ( RamLink ) 제 
품에서 볼수 있다. 램련결은 DRAM 소편들의 내부방식이 아니라 처리장치/기억기대면 


체 계 모선 



종속 ID 

71 

전송 ID 

지령 

1 최대 1 

시간 0 | 

주소바이 

트 0 


주소바이 

트 1 


주소바이 

트 2 


주소바이 

트 3 



그림 4-28. 램련결 

T-Ramlink 방식 , L - 파케트형식 
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부에 집중하였다. 

램 련결은 고리로 배렬된 점대점형식 ( point - to - point ) 의 기억기대면방식이다(그 
림 4-28 1). 고리의 통과는 DRAM 소편들(고리형망에서 마디들로서 작용하는)에 통 
보를 보내는 기 억기조종기 에 의하여 관리된다. 자료는 파케 트형 태 로 교환된다(그림 
4-28 ᄂ). 

요구된 파케 트는 기 억 기 작용을 시 동한다. 파케 트를은 조종기 에 의하여 보내 여 지 며 
지 령 머 리 부, 주소검 사합 그리 고 쓰기인 경 우 쓰기 될 자료를 포함한다. 지 령 머 리 부는 형 
태，크기 그리고 조종정보들로 구성되며 대응하는 종속기 억기 에 대 하여 허용되는 규정 
된 응답시간 혹은 최대시간을 포함한다. 조종정보는 다음요구가 어느 렬주소에 있게 되 
겠는가하는것을 가리키는 하나의 비트를 포함하고 있다. 매 장치마다 이 네 가지 작용이 
동시적으로 진행될수 있다. 그러므로 모든 파케트들은 2 bit 의 작용 ID 들을 가지고 요구 
와 정합해 보며 파케트에 애매한 점이 없이 응답한다. 

성 공적 인 읽 기 에 대 하여 DRAM 종속장치 는 읽 기 자료를 포함하는 응답파케 트를 보 
낸 다. 실패한 요구에 대 하여 종속장치 는 동작을 완성하는데 얼마만한 시 간이 요구되 는 
가를 지 적하는 상태 파케 트를 보낸 다. 

램 련결 방법의 강력한 우점 중의 하나는 적거 나 많은 수의 DRAM 들을 지 원하는 표 
준화된 방식 을 제 공하는것 이 며 내 부 DRAM 조직 을 지 적 하지 않아도 된 다는것 이 다. 램 
련결의 고리 형 배렬은 많은 DRAM 들의 활용성 을 동반하여 설계 되 였으며 기 억기 조종기 
에 대한 효률적인 결합을 제공한다. 

램 련결 에 서 최 근 강화된것 은 SDRAM 에 개 발된 기 술을 리용하는것 이 다. 현재 
SLDRAM 이 라고 한다. 
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Web 싸이트 

• The RAM Guide： 이 Web 싸이 트는 RAM 기 술과 그와 관련된 
많은 쓸모 있는 기술들의 총적개괄을 제공한다. 


련습문제 

1. 왜 RAM 들이 전통적 으로 소편당 lbit 로 구성되 였 으며 반대 로 ROM 들은 소편 
당 여 러개의 비 트로 구성되 였는가 하는 원인을 말해 보시 오. 

2. 에 64번의 재생주기를 가지게 되는 동적 RAM 을 고찰하자. 매번 재생조 
작 150ns 를 요구한다. 기 억주기는 250ns 이 다. 기 억기 총 조작시간의 몇%가 
재생에 리용되는가? 

3. 64 父 lbit 크기의 SRAM 소편을 리 용하여 총 용량이 8192bit 인 16 bit 기 억 기 
를 설계하시오. 기억기기판에서 소편의 배렬구성을 주고 제일 마지막공간에 
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배치하고 있는 기억기에 대하여 필요한 모든 입출력신호들을 표기하시오. 설 
계 는 바이 트와 16 bit 단어 호출이 가능하게 하시 오. 

4. 기 억기 에 기 억된 8 bit 자료단어 가 11000010이 라고 하자. 하밍알고리 듬을 리 용 
하여 어떤 검사비트들이 기억기에 자료단어와 함께 기억되는가를 검사하시오. 
또한 몇개의 답을 엄을수 있는가 찾아 보시오. 

5. 8 bit 단어 001110이 에 대 하여 검사비트들은 0111 로 기 억된다. 단어 가 기 억기 
로부터 읽어 질 때 검사비트들은 1101 로 계산된다. 기억기로부터 읽 어 진 자 
료단어는 어떻게 되는가? 

6. 하밍오유수정 부호가 1024 bit 자료단어 에 서 한개 의 비 트오유들을 검 사하는데 
리용된다면 얼마나 많은 검사비트들이 필요한가? 

7. 16 bit 자료단어 에 대 한 SEC 부호를 개 발하시 오. 자료단어 0101000000111001 
에 대한 부호를 생성하시오. 부호가 자료비트 4 에서의 오유를 정확히 확정하 
는 경우를 고찰하시오. 

8. 묶음련상캐쉬는 묶음당 4 개의 행 으로 된 64 개의 행들로 이루어 졌다. 주기억 
기는 매개가 128 단어들로 된 4 K 개의 블로크를 포함한다. 주기억기주소의 형 
식을 고찰하시오. 

9. 16 진수기 억 주소 111111，666666 , BBBBBB 에 대하여 16 진수형식으로 다음의 
정보들을 고찰하시오. 

그림 4-18 의 형식을 리용하여 직접배치방식에서 표식표,행，단어값 
i _. 그림 4-20 의 형식을 리용하여 완전련상배 치방식 에서 표식표와 단어값 
c . 그림 4-22 의 형식을 리용하여 두 통로묶음련상배 치방식 에서 표식표，묶음, 
단어값 

10. 4 통로묶음련상배 치 방식 인 16 KB 의 내 부캐 쉬 를 가진 32 bit 극소형 처 리 장치 를 
고찰하자. 캐쉬가 4 개의 32 bit 단어들로 한개 행을 구성한다고 가정하자. 이 
캐쉬 에 대 한 블로크도를 그리 고 구성 을 고찰하고 캐 쉬 명중률을 측정하는데 서 
로 다른 마당들이 얼마나 리 용되는가. 기 억 주소 ABCDE 8 F 8 의 단어 가 캐쉬 에 
어디에 배치되는가? 참고 [ ALEX 93] 

11. 외 부캐 쉬 에 대 하여 4통로 묶음련상방식，2개 의 16 bit 단어 의 크기 로 된 행，주 
기 억으로부터 총 4 K 의 32 bit 단어들을 조종할수 있다는 조건이 주어 졌고 
24 bit 주소를 가진 16 bit 처리장치를 리용할 때 캐쉬구조와 알맞는 정보들을 설 
계하고 처리장치의 주소들을 어떻게 분할할수 있는가를 고찰하시오. 참고 
[ ALEX 93] 

12. 인텔의 80486은 단일 방식 의 내부캐 쉬 를 가지 고 있 다. 용량은 8 KB 이 며 4통로 
묶음련상구성이고 블로크의 길이는 4 개의 32 bit 단어로 되여 있다.캐쉬는 128 
개의 묶음으로 되여 있다. 묶음마다 한개의 《행유효비트》와 LRU 비트들인 
BO , Bl , B 2 비 트들이 있 다. 캐 쉬 실패 때 에 기 억 기 가 버 스트읽 기 방식 으로된 모 
선에서 80486 은 주기억으로부터 16 byte 행을 읽는다. 캐쉬의 간단한 그림을 
그리고 주소의 서로 다른 마당들이 어떻게 분할되는가를 고찰하시오. 참고 
[ ALEX 93] 
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13. 바이트주소가능한 2 16 byte 용량을 가진 주기억기가 8 byte 의 블로크크기로 분 
할된 다고 하자. 32 행 으로 구성 된 직 접 배 치 형 캐 쉬 가 이 기 억 체 계 에 리 용된다고 
가정하자. 

자 . 16 bit 기 억주소는 꼬리표，행 번호，바이트번호로 어떻게 분할되는가? 

L. 어느 행에 다음주소를 대응하는 바이트들이 기억되는가? 

0001 0001 0001 1011 
1100 0011 0011 0100 
1101 0000 0001 1101 
1010 1010 1010 1010 

C . 주소 0001 1010 0001 1010의 바이트가 캐쉬에 기 억되 였다고 하자. 이 주소 
를 따라 기억된 다른 바이트들의 주소는 무엇인가. 
e . 기억기의 바이트가 최대로 얼마나 많이 캐쉬에 기억될수 있는가. 
n . 꼬리표는 왜 캐쉬에 기억되는가? 

14. 인텔 486 의 재배 치알고리 듬은 가짜 LRU 방식 으로 알려 졌다. L 0, LI , L 2 , L 3 
으로 표기된 4 개의 행으로 된 128 개의 묶음의 매개와 관련되는것은 BO , B 1, 
B 2 비트들이다. 재배 치 알고리듬은 다음과 같이 동작한다. 어떤 행을 재배 치하여 
야 할때 캐쉬는 처음으로 가장 최근에 리용된것이 L 0 과 L 1 로부터 혹은 L 2 과 L 3 
으로부터 주어 지는가를 검사하여야 한다. 그다음 캐쉬는 블로크쌍중의 어느것이 
가장 최근에 리용되였는가를 검사하고 재배치를 위한 블로크를 선택한다. 

. 비트 BO , Bl , B 2 가 어 떻게 설정되며 재배 치알고리듬에 어떻 게 리 용되 는 
가를 규정하시 오. 

L . 80486 알고리 듬이 진짜 LRU 알고리 듬과 근사하다는것 을 고찰하시 오. 
n . 진짜 LRU 알고리듬은 묶음당 6개의 비트를 요구한다는것을 증명 하시오. 

15. 묶음련상캐쉬는 4 개의 16 bit 단어로 된 블로크를 가지며 2 개 블로크로 된 크 
기 의 묶음을 가진 다. 캐 쉬 가 총 4048 단어 를 관리할수 있 다. 캐 쉬 에 완충가 
능한 주기 억 기 크기 는 64 K x 32 bit 이 다. 캐 쉬 구조를 설 계 하고 처 리 장치 의 주소 
가 어떻게 분할되는가를 고찰하시오. 참고 [ ALEX 93] 

16. 4통로 묶음련상캐 쉬 에서 LRU 재배 치알고리 듬을 실현하기 위한 간단한 기술을 
서 술하시 오. 

17. 다음프로그람을 고찰하자. 

for (i = 0； i < 20； i ++) 

for (j = 0； j < 10； j ++) 
a [ i ] = a [ i ] * j 
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-1. 프로그람에서 공간적국부성의 한 실례를 드시오. 

L. 프로그람에서 시 간적국부선의 한 실례 를 드시 오. 

18. N 개준위기억기의 계층을 위한 부록4의 식 4-1 과 식 4-2 를 설명하시오. 

19. 를퓨터체 계는 32K16bit 단어의 주기 억기 를 가지고 있다. 또한 한행 이 64 단어 
이고 4 개 행을 가지는 묶음으로 분할된 4K 단어캐쉬를 가지고 있다. 캐쉬가 
초기에 비였다고 가정하자. 처리장치는 주소 0, 1，2，…，4351로부터 순서대 
로 단어들을 꺼낸다. 그다음 이 꺼내기를 순차적으로 9 번 더 반복한다. 캐쉬 
는 주기 억 보다 10 배 더 빠르다. 캐쉬의 리용으로부터 나타나는 성능개선을 
평 가하시오. 블로크재배 치를 LRU 방법 이 라고 가정 한다. 

20. 다음과 같은 파라메터 들을 가진 기 억 체 계 를 고찰하자. 

T c = 100ns Cc = 0. 이쎈트 /bit 
T m = 1200ns C m = 0.001 쎈트 /bit 
1. 1Mbyte 기 억기의 가격은 얼마인가? 

캐쉬기억기기술을 리용한 1Mbyte 주기억기의 가격은 얼마인가? 
n. 실제 호출시간이 캐쉬호출시간보다 10% 크다면 캐쉬명중률 H 는 얼마인가? 

21. 콤퓨터 는 캐 쉬，주기억 기 그리 고 가상기 억 으로 리 용되 는 디 스크를 가지 고 있 
다. 참조되 는 단어 가 캐 쉬 에 있 다면 그 호출에 20ns 가 요구된다. 주기 억 기 에 
만 있고 캐 쉬 에 없다면 그 단어를 캐쉬 에 넣 기 하는데 60ns 요구되며 참조시 
간은 처 음의 경 우와 같다. 만일 단어 가 주기억 기 에 없 다면 디 스크로부터 단어 
를 꺼 내 는데 12ms 가 60ns 에 의 하여 캐 쉬 h 에 복사되 며 첫 경 우와 같이 참조 
가 진행된다. 캐쉬의 명중률은 0.9 이며 주기억기의 명중률은 0.6 이다. 이 체 
계에서 참조되는 단어를 호출하는데 요구되는 평균시간은 몇 ns 인가? 


부록 4. 2준위기억기의 성능특성 

이 장에서 기 억참조는 2준위내부기 억기 로 구성되 면서 주기억기와 처 리 장치사이 에 
완충기 로서 작용하는 캐쉬 에서 이루어 진다. 2준위방식은 부록에서 소개하는 국부성의 
성질을 실현함으로써 1준위기억기에 비하여 우월한 성능을 가진다. 

주기억기캐쉬 기구는 콤퓨터기 본방식 의 한 부분이 며 장치적 으로 실현되 고 조작체 계 
에 의 해서는 볼수 없다. 국부성 을 실현한 2준위 기 억방법의 두가지 다른 실례들이 있 
으며 그것은 마지막부분으로서 조작체 계 에 의하여 실현된다. 즉 가상기 억기와 디스크 
캐 쉬 를 말한다(표 4-8). 가상기 억 기 는 제 7 장에 서 주었 다. 디 스크캐 쉬 는 이 책 의 범 위 
를 넘어 서므로 [STAL98] 에서 찾아 보시오. 이 부록에서는 모두 세가지 방법으로 공 
124 



주기 억기캐쉬 가상기억기 (페지방식 ) 디스크캐쉬 

일반적인 호출속도 5/ 1000/1 1000/1 

기억기관리체계 특수한 장치로 실현 장치와 체계프로그람의 결합 체계프로그람 
일반적인 블로크 크기 4〜 128 byte 64〜 4096 byte 64〜 4096 byte 

2차준위 에 대 한 처 리 직 접 호출 간접 호출 간접 호출 

장치의 호출 

1. 국부성 

2 준위기 억기의 성능개선을 위한 기초는 참조의 국부성 이 라고 하는 원리 이 다 
[ DENN 68]. 이 원리 는 기 억 기 참조가 클라스터 에 귀 착된다는것 을 반영 하고 있 다. 오 
랜시 간 지 나면 리 용에 서 클라스터 들이 교체 되 지 만 짧은시 간 동안에 는 처 리 장치 가 기 억 
기참조로서 고정 된 클라스에 서 기 본적 으로 작업한다. 

국부성의 원리는 직관적으로 알수 있다. 다음의 추리방향을 고찰하자. 

• 모든 프로그람명 령 중에 적 은 부분을 차지하는 분기 와 호출명 령 을 제 외 
하면 프로그람집행은 순차적이다. 결국 대부분의 경우에 꺼내여 지는 
다음명령은 현 시점에서 마지막으로 꺼낸 명령에 직접 이어 진다. 

• 호출명 령 에 의하여 호출되 는 보조프로그람들이 끊어 짐 이 없 이 매 우 
길어 지게 되는 경우는 거의 없다. 오히 려 프로그람은 틀의 심도가 어 
느 정도 좁은 창문(부분)으로 되 도록 구성한다. 따라서 짧은 시 간동안 
에는 명령들에 대한 참조가 작은 틀들에 대하여 국부적으로 진행될 경 
향성이 많다. 

• 대부분 반복적인 구성들은 많은 회수로 반복되는 상대적으로 적은 수 
의 명령들로 이루어 진다. 그러므로 반복되는 지속시간에 대하여 계산 
을 프로그람의 작은 린접 적인 부분에 극한된다. 

• 많은 프로그람들에서 대부분의 계산은 배렬 혹은 레코드들의 렬과 같 
은 처 리자료구조를 가진다. 많은 경우에 이 자료구조에 대한 련속적 인 
참조는 엄밀하게 국부적 인 항들에 대한것 이 다. 

이 추리방향은 많은 연구들에 의하여 확증되 였 다. 첫번째 추리방법 에 대 하 
여 고수준언 어프로그람들의 동작상태 들을 분석하였 다. 표 4-9 는 다음과 갈은 
연구들로부터 집 행 중에 여 러 가지 명 령 형 태 들의 출현 을 측정 한 기 본결 과들을 포 
함하였다. 크느츠 [KNUT 기에 의하여 완성된 프로그람언어구성형식에 대한 초 
기 연구는 대 학생 실험 으로서 리 용된 FORTRAN 프로그람의 묶음을 조사하였다. 
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표 4-9. 고수준언어연산의 상대 적 인 동적 주기 


학 습 

[HUCK8 却 

[KNUT71] 

[PATT82] 

[TANE78] 

언 어 

Pascal 

FORTRAN 

Pascal 

C 

SAL 

과학 

대학생 

System 

System 

System 

Assign 

74 

67 

45 

38 

42 

Loop 

4 

3 

5 

3 

4 

Call 

1 

3 

15 

12 

12 

IF 

20 

11 

29 

43 

36 

GOTO 

2 

9 


3 


Other 


7 

6 

1 

6 


탠 년 바움 [ TANE 78] 은 조작체 계 에 서 리 용되 고 구조체 프로그 람작성 법 ( SAC ) 을 
지 원하는 언어로 작성된 300 개 틀들로부터 얻 어 진 측정 들을 공개하였 다. 페 터순 
과 씨 쿼 인 [ PATT 82 a ] 는 콤파일 러 들과 편집 기 , CAD , 정 렬 프로그람 ( sorting ) 과 파 
일 비 교프로그람들로 부터 주어 진 측정 들의 묶음을 분석하였 다. 프로그람작성언 어 
인 C 와 파스칼이 연구되 였 다. 후크는 [ HUCK 83] 고속푸러 에변환과 미 분방정 식 들 
의 통합체계 들을 포함하는 혼합형일 반용과학계산을 위한것들이 4 개의 프로그람들 
을 분석 하였 다. 분기 와 호출명 령 들이 프로그람이 집 행 되 는 동안 집 행 되 는 명 령 들 
의 극히 일부만이 존재하는 언어 들과 응용프로그람들의 경 우에 는 좋은 결과를 얻 
는다. 따라서 이 연구들은 주장1을 확정하였 다. 

주장 2 에 대해서는 [ PATT 85 a ] 에 보고된 연구들이 이 주장의 증명을 제공한다. 
이것은 Call-return 구성을 보여 주는 그림 4-29 에서 설명 하였다. 매 호출은 오른쪽으 


시간 
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로 이동하면서 아래로 향한 선들로, 매개 되돌이는 오른쪽으로 이동하면서 우로 향한 
선들로 표시되였다. 그림에서 길이가 5 인 창문에 대하여 보여 주었다. 다른 한편으로 
오직 6 개의 봉우리들로 된 련속적인 호출과 되돌이들은 창문내에서 발생한다. 보는바 
와 같이 집행하고 있는 프로그람은 오랜 시간 고정된 창문에서 유지된다. C 와 파스칼 
프로그람들에 대한 같은 분석자들의 연구는 길이가 8 인 창문을 호출이나 되돌이들의 
1%이하로만 바꿔 지는것을 요구한다 [ TAMI 83]. 

국부성참조의 원리 는 최 근 연구들에서 계속 유효하게 되 였다. 실례 로 그림 4-30 
에 하나의 기지 에서 Web 페지호출패 턴들에 대 한 결과를 주었다. 공간적국부성과 시 간 
적국부성은 서술에서 차이가 있다. 공간적국부 성은 묶음으로 된 여러개의 기억주소들 
에서 집행의 경향성이 있다고 말하는것이다. 이것은 자료들의 표를 처리할 때와 
같이 순차적으로 명령들을 호출하는 처리장치의 경향성에 따른다. 시간적국부 성은 
최근에 리용된 기 억주소들을 호출하는 처 리장치에서의 경향성 이라고 말하는것 이 다. 실 
례 로 반복순환이 집 행될 때 처 리장치는 반복적으로 같은 명 령들의 모임 을 집 행한다. 

2. 2준우 I 기억기의 조작 



루적된 문서수작성과정 

그림 4-30. Web 페 지 에 대 한 참조의 국부성 

국부성의 성질을 2 준위기억기형식에서 얻을수 있다. 웃준위기억기 ( Ml ) 는 아래준 
위기억기 ( M 2) 보다 기 억용량이 작고 속도가 빠르며 더 비용이 많이 든다. Ml 는 용량 
이 큰 M 2 의 내 용들의 일부분을 림시 기 억 하는데 리 용된다. 기 억기참조가 이 루어 질 때 
출발은 M 12 의 항을 호출하도록 한다. 만일 성공이 라면 빠른 호출이 이루어 진다. 만 
일 실패라면 해당 기억기블로크가 M 2 로부터 Ml 로 복사되며 Ml 에 배치된 조건에서 
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호출을 진행한다. 국부성 으로 인 하여 일 단 블로크가 Ml 로 전송되 면 블로크내 의 주소 
들은 여러번 호출될수 있으며 전반적인 봉사가 빠르게 진행된다. 

항목을 호출하는 평 균시 간을 식 으로 표시 하기 위하여 2 개 준위 의 기 억 기들의 속 
도뿐아니 라 주어 진 참조가 Ml 에서 진행될 확률까지 로 고찰하여 야 한다， 

T s = HxT t + (1 - K ) X (刀 + T 2 ) = (4-1) 

= T ! + (1 - H ) X T 2 

여 기 서 T s - 평 균(체 계 ) 호출시 간, 

T ,- 평균(체계)호출시 간， 

T 2 - Ml (캐 쉬，디 스크캐 쉬 등) 의 호출시 간， 

H - 명중률(호출되는 부분이 Ml 에 있는 경우) 

그림 4-2 에서는 명중률의 함수로서 평균호출시 간을 보여 주었다. 보는바와 같이 
명 중률이 높으면 평 균총호출시 간이 M 2 보다 Ml 의 것 에 가까워 진다. 

3. 성능 

2준위 기 억 장치 의 평 가를 위하여 관련되 는 일부 파라메터 들을 고찰하자. 

처음으로 가격을 고찰하자. 

C = 대+여 (4-2) 

s S l + s 2 

여기서 c s - 결합된 2 준위기억기에서의 비트당 평균가격， 

Q - 웃준위 기 억 기 Ml 에 서 비 트당 평 균가격 , 

C 2 - 아래 준위 기 억 기 M 2 에 서 비 트당 평 균가격， 

S 厂 Ml 의 크기 , 

S 厂 M 2 의 크기 

기억기체계에서 C s 로 되여야 한다. 로 주어 지고 起 《 S 2 일것을 요 

구한다. 그림 4-31 에서는 이 관계를 보여 주었다. 

다음으로 호출시 간을 고찰하자. 충분한 성 능개 선을 제 공하는 2준위 기 억 기 에 대 하 
여 지와 근사하게 되는 T S ( T S 义 刀)를 가질것을 요구한다. 刀가 : T 2 보다 대 단히 작게 
( T 2 < T 2 ) 주어 지고 1에 가까운 명중률이 요구된다. 
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이렇게 명중률과 그에 의한 성능이 높으며 가격을 눅게 하는 작은 Ml 로 되여야 
한다. 이 론리 적 인 크기 에 대 한 두가지 요구를 만족하는 Ml 의 크기 가 있는가? 우리 는 





1 … 8 a ioo 

2 준위 상래 크기 


그림 4-31. 2 준위기 억기 에서 기 억기크기와 평균기 억기가격의 관계 
다음물음들로 이 질문에 대답할수 있다. 

• 성 능요구를 만족하기 위하여 얼 마만한 명 중률 이 요구되 는가? 

• 요구되 는 명 중률은 Ml 의 얼 마만한 크기 의 Ml 를 담보할수 있는가? 

• 이 크기는 가격의 요구를 만족시키는가? 

이 대 답을 얻 기 위하여 호출효률이라고 하는 T \/ T s 량을 고찰하자. 평 균호출시 간 ( T s ) 
이 Ml 호출시간 ( Ti ) 에로 어떻게 다가가는가 하는 측정을 하자. 

식 4-1 로부터 

I _ L 

t 2 


i+(i+//) 


T, 


(4-3) 





이 주어 진다. 
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그림 4-32 에서 파라메 터 로서 TVTj 량과 명 중률 H 의 함수로서 刀/1를 그리 였 다. 



명중률= H 


그림 4-32. 명 중률함수로서의 호출효률 、 r = TjT 公 

일반적으로 캐쉬호출시간은 주기 억기호출시간보다 대략 5 〜 10배 (7 y ; = 5乂 L 0 
배) 빠르며 주기억기 호출시간은 디스크호출시 간보다 약 1000 배정도 빠르다 (7는/刀 = 
1000). 따라서 0.8 〜 0.9 범위의 명중률이 성능요구를 만족시키는데 필요로 된다. 더 
정확하게 상대적인 기억기크기에 대한 질문을 제기할수 있다. Si 《 S 2 에 대하여 0.8 
의 명중률이나 그이상 더 적당한것이 있을수 있는가? 

이 것 은 집 행 하고 있는 프로그람의 내 용과 2 준위 기 억 기 의 설 계 세 부를 포함하는 여 
러인 자들에 의 존한다. 물론 기 본적 으로 명 백 한것 은 국부성 의 정 수이 다. 그림 4-33 은 
국부성 이 명중률에 미치는 효률을 시사하였다. 명백히 Ml 과 M 2 가 크기가 갈으면 명 
중률은 1 일것 이 다. M 2 에서의 모든 항들은 항상 Ml 에 기 억된다. 이계 국부성 이 없다 
고 가정 하자. 즉 참조는 란수적 으로 실 현된 다고 하자. 이 경 우에 명 중률은 기 억 기비 률 
에 대 하여 완전한 선형함수이다. 실례 로 Ml 과 M 2 의 크기 에 절반이 라면 이때 명중률 
은 0.5 이다. 그러나 실제적으로 참조에는 어느 정도 국부성이 있다. 중간정도와 강한 
국부성 의 효률을 그림 4-33 에 주었 다. 
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그림 4-33. 상대기 억기크기에 대한 명중률 


만일 국부성 이 강하면 상대 적 으로 작은 크기 의 높은 준위기 억 기 라고 하여 도 높은 
명 중률을 달성하는것 이 가능하다. 실제 로 여 러 연구들은 오히 려 주기억 기 크기 에 관계 
없이 작은 크기의 캐쉬들이 약 0.75 의 명중률을 가질수 있다는것을 보여 주었다. 

([ AGAR 89 a ] ， [ PRZY 88] , [ STRE 83] , [ SMIT 82] , …) . 주기 억 기 가 현재 수 MB 범 위 
에 있는 사실에 비추어 보면 1 K 로부터 128 K 단어범위캐쉬들이 일반적 으로 적 당하다. 

가상기 억기와 디스크캐쉬를 고찰할 때 같은 현상을 확정하는 다시말하여 상대 적으로 
작은 Ml 가 국부성 에 의하여 높은 명 중률을 가진다는것 을 확정하는 다른 연구들을 소 
개할수 있 다. 

이것은 이미 제기된 마지막질문을 준다. 즉 두 기억기의 상대적크기가 가격상 요 
구를 만족시키는가? 대답은 명백히《예》이다. 좋은 성능을 달성하기 위하여 상대적으 
로 용량이 작은 웃준위 기 억기를 요구한다면 그때 2준위 기 억 기의 비트당 평 균가격은 
아래 준위 기 억 기의 가격 과 근사하게 될 것 이 다. 
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제 5 장. 외부기억기 




♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦ 

♦ 자기디스크는 여전히 외부기억기의 가장 중요한 구성부분이다. 넣었다꺼냈다할수 
있는 디스크와 고정된 디스크(하드디스크》들은 개 인용콤퓨터로부터 대형콤퓨터와 슈 
퍼콤퓨터에 이르기까지의 모든 체계에서 쓰인다. 

♦ 더 큰 성능과 높은 리용성을 얻기 위하여 봉사기와 대형체계상에서 일반적으로 쓰 
이 는 방식 은 RAID(Redundant Array of Independent Disks ) 디 스크기 술이 다. RAID 는 자료 
기 억 장치 들을 병 렬로 배 렬하여 다중디스크들을 리용하기 위한 기술들의 집 합이라고 
할수 있다. 이것은 디 스크고장을 보상하기 위하여 약간 여 유 있게 설 치한다. 

♦ 빛기억기기술은 모든 형태의 콤퓨터체계에서 아주 중요하게 제기된다. 한편 
CD-ROM 은 오래 동안 널 리 리용되 여 왔고 오늘날에 는 쓰기할수 있 는 CD 와 자기빛 
기억기 ( MO ) 와 같은 현대기술들이 더욱더 중요한것으로 제기되고 있다. 

♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦총 

이 장에서는 외부장치와 체계들의 범위를 고찰한다. 제 1절에서는 가장 중요한 장치 
인 자기디스크부터 고찰한다. 자기디스크는 사실상 모든 를퓨터체 계 에서 외부기 억기의 
기본을 이룬다. 다음절은 RAID 라고 하는 체계계렬로 특별히 찾아 볼수 있는 보다 높은 
성 능을 가진 디 스크배 렬들의 리용을 고찰한다. 많은 콤퓨터 체 계 에서 더 욱더 중요한 구성 
부분은 외부빛기 억기 이며 이것은 제 3 절에서 보기 로 한다. 마지 막으로 자기레 프에 대 하 
여 서술하였다. 
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제 1 절. 자기디스크 


디스크는 자성물질로 피복한 금속 또는 수지로 된 원판이다. 자료는 자두라 고 하는 
유도성선륜을 거처서 디스크에 기록할수도 있고 읽을수도 있다. 읽기나 쓰기조작할 때 
자두는 멈춰 져 있으며 그때 원판은 그아래에서 회전한다. 

쓰기는 선륜을 통해 흐르는 전류에 의하여 자기마당이 만들어 진다는 원리에 기초 
하고 있다. 임풀스는 자두에 전송되며 자기적패턴은 양전기와 음전기에 따라 서로 다른 
패런들로 되면서 아래면에 기록된다. 읽기는 선륜에 대해 상대적으로 움직이는 자기마당 
이 선륜에 전류를 발생시킨다는 원리에 기초하고 있다. 디스크면이 자두밑을 지날 때 자 
두에는 이미 디스크면에 기록되여 있는 자기적패턴과 같은 극성의 전류가 발생한다. 

1 . 자료구성과 형식 


자두는 그아래에서 돌아 가는 원판의 부분에 대한 읽기나 쓰기능력을 가진 비교적 
작은 장치이다. 이것은 자리 길이라고 불리우는 고리들의 동심원묶음으로 원판우에 자료 
를 구성한다. 매 자리 길 은 자두와 같은 폭을 가전 다. 이 폭은 일 반적 으로 500〜2000 자 
리길/면이다. 

그림 5-1 은 이 자료기록형식을 보여 준다. 린접자리길들은 간격에 의해 구분된다. 
이 것은 자두의 제 작상 오유나 자기 마당들의 호상간섭 에 의한 장애를 막거 나 될수록 작게 
하자는데 있 다. 전자기 구를 간소화하기 위하여 일 반적 으로 매 자리길 에 같은 수의 비 트 
를 기 억시 킨다. 따라서 인치 당 비트수로 지적되는 밀도는 제 일 바깥자리길로부터 제 일 
안쪽자리 길 까지 이 동하면서 증가한다. 

자료는 블로크 단위로 디스크에로 혹은 디스크로부터 전송된다. 일반적으로 블로크 
는 자리길의 용량보다 작다. 대체로 자료는 분구라 고 하는 블로크크기로 기억된다(그림 
5-1) . 일반적으로 자리길당 분구수는 10-100 개의 범위이며 고정 혹은 가변길이형식중 



의 하나로 되여 있다. 체계에서 특별 
히 지 나친 밀 도요구를 피 하기 위하여 
린 접한 분구들은 분구들사이 의 간격 
들로 구분된다. 

일 부 방법 들은 자리길안의 분구위 
치들을 찾아 낼것을 요구한다. 명백 
한것은 자리길의 어떤 시작점이 있어 
야 하며 매 분구의 시작과 끝을 지적 
하는 방법이 있어야 한다는것이다. 
이 요구들은 디스크에 기록된 조종자 
료에 의하여 실현된 다. 따라서 디 스 
크는 디 스크구동에만 리용되 는 몇개 
의 확장자료들로 형식화되며 사용자 
는 이 자료를 호출하지 못한다. 

디스크형식화의 실례를 그림 5-2 


에 주었다. 이 경우에 매개 자리길은 


그림 5-1. 디스크자료배치도 


매개 분구가 600 byte 로 된 30 개의 
고정길이분구를 가진다. 매개 분구는 
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L 와 디스크조종기에 필요한 조종정보를 가전다. ID 마당은 개별적 인 분 
9하여 리용되는 유일한 지적자 혹은 주소이다. 동기바이트는 마당의 
특수한 비트렬이다. 자리길번호는 면우의 자리길을 가리킨다. 디스크 
斗지 므로 자두번호는 자두를 지 적한다. ID 와 매 개 자료마당들은 오유검 


ID |Gap I 자료 | Gap |Gap I ID I Gap | 자료 I Gap 1 
I •당산2 | 마당 o|3 il | 마당; l|2 | 마당대3 


I Gap I ID I Gap | 자료 |Gap 
I 1 I 마당 29|2 I 아당여3 

1.17 7 41 515 20 


그림 5-2. 원체 스터 디 스크의 자리 길형 식 (Seagate ST506) 


자기 디 스크의 여 러 가지 형 태 들을 구별 하는 기 본특성 들을 주었 다. 첫 째 
반경방향으로 고정되거 나 이동할수 있어 야 한다. 고정자두 디스크에서 
기 -쓰기자두가 하나씩 있 다. 모든 자두는 자리길 에 가로 놓인 든든한 
■(그림 5-3 자) . 이동자두 디스크에서는 읽기-쓰기자두 한개만 있다. 역 
설치된다(그림 5-3 L ). 자두가 임의의 자리길우에 놓일수 있어야 히 







디스크자체는 팔과 디스크를 회전시키는 기구 그리고 자료를 입출력하는데 필요한 
전자장치 들로 구성된 디 스크구동기 에 설 치된다. 하드디 스크는 디 스크구동기 에 영구적 으 
로 설치된다. 넣었다꺼냈다할수 있는 디스크(플로피디스크)는 구동기에서 꺼낼수 있으며 
다른 디스크로 바물수 있다. 플로피 디스크의 우점은 제 한된 디스크체계들에서 많은 자료 
들을 리용할수 있다는것 이 다. 그러므로 이 런 디스크들은 한 콤퓨터체계로부터 다른 콤퓨 
터체계에로 옮겨 갈수 있다. 


표 5-1. 디스크체계의 물리적특성 


자두이 동 

원판수 

고정자두식(자리길 당 하나) 

단일원판 

이동자두식(면 당 하나) 

다중원판 

디스크휴대 성 

자두동작 

비 제 거 형 디 스크 

접 촉형 (유연성 자기 디 스크) 

제거 형디 스크 

고정 간격 

면수 

공기 부력 식 간격 (원체 스터 ) 

단일면 식 


2 중면 식 



회전축 



기) 

읽기/쓰기 자두 (1/ 면) 



L) 

그림 5-4. 다중원판디스크 


대부분의 디스크들에는 자화층이 
량면원판의 두면에 입혀져 있다. 
일부 값이 눅은 디스크체계들에서는 
단면 디 스크를 리용한다. 

일부 디 스크구동기 들은 인치정 도 
의 간격으로 수직으로 겹쌓인 여러 
개 의 원판들을 조정한다(그림 5-4). 
여기에는 여러개의 자두팔들이 설치 
된다. 원판들은 디 스크묶음이라고 
하는 장치에 설치된다. 

마지 막으로 자두기 구는 세 가지 형 
태로 디스크들을 분류한다. 전통적 
으로 읽 기 -쓰기자두는 원 판우에 일 
정한 간격 을 두고 위 치한다. 또 다 
른 하나는 읽기/쓰기 를 조작하면서 
매체에 물리적으로 접속되는 자두기 
구이다. 이 기구는 작고 유연하며 
가장 값이 눅은 디스크형태 인 플로 
피디 스크에 리 용된 다. 

디스크의 세번째 형식을 리해하기 
위하여서는 자료밀도와 원관과 자두 
의 공간크기사이의 관계를 아는것이 
필요하다. 자두가 정 확히 쓰거 나 읽 
기 위 해서 는 충분히 큰 전자기마당 
을 발생 시키거 나 수감할수 있어 야 
한다. 간격이 좁은 자두일수록 자기 
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기능을 수행하기 위하여 원판면에 더 가까이 접근해야 한다. 더 좁은 자두일수록 자리길 
을 더 좁게 하며 따라서 바라는 자료밀도는 더 커진다. 그러 나 자두가 원판에 접근할수 
록 불순물이나 설치의 불합리성으로 인한 오유발생률이 커진다. 기술이 발전함에 따라 
원체 스터 디 스크가 개 발되 였 다. 원체 스터 자두는 거의 먼지 가 없는 밀 봉된 구동기 묶음들에 
리용된다. 이것들은 전통적 인 고정 디스크자두보다 디스크의 면에 더 가까이 접근하도록 
설계되였다. 따라서 자료밀도가 아주 크다. 자두는 디스크가 움직이지 않을 때 실제로 
원판면우에 가볍게 놓여 있는 기체력학식금속판이다. 회전하는 디스크에 의하여 일어 나 
는 공기의 부력은 원판면우에서 금속판을 띄우는데 충분하다. 이와 같은 비접촉체계는 
전통적인 하드디스크자두보다 원판면에 자두를 더 가까이 접근시킬수 있다. 1 

3. 디스크성능지표 

디스크 I/O 조작의 실제적 인 세부들은 콤퓨터체계 즉 조작체계, I/O 통로의 성질, 디스 
크조종장치 에 의 존한다. 디 스크 FO 전송의 일 반적 인 시 간선도를 그림 5-5 에 보여 주었 다. 



장치동작상태 


그림 5-5. 디 스크 I/O 전송의 시 간선도 

디스크구동기가 동작하고 있을 때 디스크는 정상적인 속도로 회전한다. 읽기나 쓰 
기를 하기 위 하여 자두는 요구하는 자리 길 파 그 자리 길의 요구하는 분구에 설치되여야 
한다. 자리길선택 은 이동식 자두체 계 인 경 우에 자두를 이 동시키 고 고정 자두체 계 인 경 우에 
해 당 자두를 전기적 으로 선택하는 동작을 진행한다. 자리길에 자두를 설치하는데 걸 리는 
시 간을 탐색 시 간이 라고 한다. 어 떤 경 우에 는 일 단 자리길 이 선택 되 면 디 스크조종기 는 해 
당한 분구가 자두와 일 치하는 선상에 서 되 돌아 올 때 까지 기 다린 다. 분구의 시 작부분이 
자두에 도착할 때 까지 의 시 간을 회 전지연이라고 한다. 탐색 시 간과 회 전지연의 합이 호출 
시간이 다. 이 시 간이 바로 읽기 나 쓰기를 위한 위 치를 차지할 때까지 걸리는 시간이 다. 
일단 자두가 위치를 차지하면 그다음 읽기나 쓰기조작은 분구가 자두밑을 통과함으로써 
수행된다. 이것이 조작의 자료전송부분이다. 

일 반적 으로 호출시 간과 전송시 간외 에 디 스크 I/O 조작과 관련된 여 러 가지 대 기 지 연이 
있다. 처 리 공정 이 FO 요구를 발생할 때 우선 이 요구를 리용하기 위한 장치 는 대 기렬에 
서 기다려야 한다. 그다음 장치 는 처 리 공정 에 할당된 다. 만일 장치 가 단일 I/O 통로나 V 0 
통로들의 묶음과 다른 디스크구동기들을 공유한다면 그때 리용할수 있는 통로에 대 하여 


1 력 사적 으로 흥미 있는 Winchester 라는 말은 이 디 스크가 개 발되 기 전에 3340디스크형 에서 코드훠 이 
틈으로 IBM 이 리용하였다. 3340은 묶음단에 밀폐식자두를 가진 이동식디스크묶음이였다. 이 용어는 
현재 기체력학식자두설계로 만든 임의의 밀봉된 디스크구동기에 적용되고 있다. Winchester 디스크는 
개 인용콤퓨터 와 워 크스테 이션에 설치 되며 거 기서는 하드디 스크라고 한다. 
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추가적인 기다림이 생길수 있다. 이 점에서 디스크호출을 시작하기 위하여 탐색을 진행 
한다. 

일부 대형콤퓨터체 계 에서 순환위 치수값 ( RPS 》 이 라고 하는 기술을 리용한다. 이것은 
다음과 같이 동작한다. 람색 명 령 이 통과되 였 을 때 통로는 다른 I/O 조작을 하기 위하여 
해 방된다. 탐색 이 완성되 였을 때 장치 는 언제 자료가 자두밑 에 돌아 오는가를 확정한다. 

해당 분구가 자두에 접근하면 장치는 주콤퓨터에로 통신로를 회복하도록 한다. 만일 
조종장치 나 I/O 통로가 다른 I/O 조작상태 에 있으면 그때 결합시도는 실패 로 되며 장치는 
RPS 실패라고 하는 재결합을 시도하기전에 전체순환을 바꾸어야 한다. 이것은 그림 5-5 
에서 시 간축에 더 추가되는 확장된 지 연요소이 다. 


림색시 근上 

람색시 간은 요구하는 자리길에 로 디스크지지 대를 이동시 키는데 요구되 는 시 간이 다. 
이 시 간은 고정시키기 어 려운 량이다. 람색시 간은 여 러 가지 기본구성요소들로 이루어 진 
다. 즉 초기시동시간, 일단 호출지지대가 속도를 높이면 교차해 야 할 자리길들을 가로 
지르는데 걸리는 시 간이 다. 그러 나 가로 지르는데 걸리는 시 간은 자리길수와 선형관계를 
가지지 않는다. 다음의 1차식으로 근사화할수 있다. 


여기서 


T s = m xh + s 

T s - 평 가하려 는 람색시 간， 
n - 가로 지른 자리길수， 
m - 디스크구동기 에 의존하는 상수， 
s - 시동시간 


실례로 개인용콤퓨터에서 값이 눅읖 하드디스크는 m =0.3 ms , s =20 ns 정도이다. 한편 더 
크고 비싼 디 스크구동기 는 m =0.1 ms ， s =3 ms 이 다. 

순환지 연 

유연성 자기 디 스크와 다른 디 스크들인 경 우 일 반적 으로 분당 회 전수는 3000r/min 이 며 
따라서 1회의 회 전시 간은 16.7ms 이 다. 그러 므로 평균지연은 100 〜 200ms 사이 에 있다. 

전송시간 

디스크에 대한 전송시간은 다음식에서와 같이 디스크의 회전속도에 의존한다. 



rN 


여기서 T - 전송시간, - 전송되는 바이트수, 

N - 자리 길 당 바이 트수, r - 회 전속도, r/S 


따라서 총적 인 평 균호출시 간은 다음과 같이 결정할수 있 다. 



b _ 

~rN 


여기서 


r s - 평균탐색 시간 
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시간비교 

앞에서 정의한 파라메터들에 대하여 평균값들에 대한 의존위험성을 보여 주는 서로 다 
른 두가지 VO 조작들을 고찰해 보자. 평균탐색시 간이 20ms, 전송속도가 lMbyte/s, 한개 자리 
길 이 32 개 분구이 고 매 분구가 512byte 인 일반디 스크를 고찰하자. 256 개의 분구로 구성된 
총 128KB 의 파일을 읽 으러 고 한다고 가정 하자. 이 때 전송을 위 한 총 시 간을 계 산해 보자. 

우선 파일 이 디스크에 조밀하게 기 억되 여 있다고 가정한다. 즉 파일은 8 개의 린접 
자리 길 (8 자리길 X 32 분구/자리 길닏56 분구)의 모든 분구를 차지 한다. 이 것을 순차적구성 
이 라고 한다. 이때 첫번째 자리길을 읽는 시간은 다음과 같다. 

평균람색 20.0 ms 

회 전지연 8.3 ms 

32분구읽 기 16.7 ms 

45 ms 

나머 지 자리 길 들은 실제 적 으로 람색 시 간없 이 읽 기 할수 있 다. 즉 I/O 조작은 디 스크의 
이 동(회 전)으로 유지할수 있 다. 이 때 대 부분의 련속적 으로 뒤따르는 매 개 자리길 에 대 하 
여 회전지연만이 필요하다. 따라서 매개 련속적인 자리길은 8.3 X 16.7=25ms 로 읽기된다. 
전체 파일 을 읽 는데 는 다음과 갈은 시 간이 걸린 다. 

총 시간 = 45 + 7 X 25 — 220ms — 0.22s 

이 제 순차적호출보다 자유호출을 리용하는 경 우 같은 자료를 읽 는데 요구되 는 시 간 
을 계산하자. 즉 디스크우에 임의로 분산된 분구들을 호출한다. 매 분구에 대하여 


평균람색 

20.0 ms 

회전지 연 

8. 3 ms 

32 분구읽 기 

0.5 ms 


28.8 ms 

총 시 간=256 X 28. 8= 7373ns= 7.37s 


이다. 

총 분구들이 디 스크로부터 읽 어 지는 순서 가 I/O 성 능에 큰 영 향을 준다는것은 명백하 
다. 여 러 분구들이 읽 거 나 써 지 는 파일 을 호출하는 경 우에 자료의 분구들을 전개하는 방법 
에 대한 몇가지 조종이 있으며 다음장에서 이 문제를 설명하도록 한다. 그러나 파일호출의 
경우에도 다중프로그람환경에서 갈은 디스크에 대한 경쟁을 요구하는 FO 들이 있을수 있 
다. 따라서 디스크 I/O 의 성능이 디스크에 대 한 순전히 우연적 인 호출로 이루어 지는 경우 
개선할수 있는 방법을 조사하여야 한다. 이것은 이 책에서 고찰하는 범위가 아니며 조작 
체계의 범위 인 디스크순서짜기알고리듬의 고찰에 귀 착된다 ([STAL9 到을 참고). 

제 2 절. RAID 

이 미 론의 된바와 같이 2 차기 억 기 성 능의 발전속도는 처 리 장치 와 주기 억 기 의 속도보 
다 현저 하게 뜨다. 이 불균형 으로부터 전반적 인 콤퓨터 체 계 성 능을 개 선하는데 서 주되 는 
초점 으로 되는것은 대체 로 디스크기 억장치체계 이 다. 
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를퓨터성 능의 다른 범위에서처 럼 디스크기 억장치설계 자는 지금까지 한개 디스크구 
성에만 힘을 넣었지만 더 높은 성능을 얻자면 다중병렬구성을 리용해야 한다는것을 인식 
하였다. 디스크기억장치의 경우에 이것은 독립적으로 그리고 병렬로 조작하는 디스크배 
렬구성을 개발하게 한다. 다중디스크에서 갈라 진 디스크들에 요구하는 자료들이 오래동 
안 상주하므로 갈라 진 I/O 요구들은 병 렬로 조종될수 있다. 

다중디스크들의 리용과 함께 자료를 구성하는 여 러가지 방법들이 있으며 이 방법들 
에서는 믿음성을 개선하기 위하여 여유를 추가할수 있다. 이것은 여러개의 가동환경과 
조작체 계 들에 서 리 용할수 있 는 자료기 지 를 개 발하는것 을 저 애 한다. 다행 스럽 게 도 산업 분 
야에서는 RAID 라고 하는 다중디스크자료기지의 규격화된 설계방식 에 대 한 의견일치를 
보았다. RAID 방식은 0-6 까지 7개 준위로 이루어 졌다. 2 이 준위들은 계층적관계를 의 
미 하는것 이 아니 라 3 개 의 공통적 인 특성 들을 공유하는 여 러 가지 설 계 방식 들을 지 적 한것 
이 다. 이 3가지 공통적 인 특성 들은 다음과 갈다. 

• RAID 는 조작체계 가 단일국부구동기로서 리해하는 물리적디스크구동기들의 묶음 
이다. 

• 자료는 물리적구동기배렬전체에 분포된다. 

• 여 유디 스크용량은 기 우성정 보를 기 억하는데 리 용되며 이 것은 디스크에 오유가 생 
긴 경우에 자료의 회복을 담보한다. 

두번째 와 세번째 특성 들의 세 부내 용은 서 로 다른 RAID 준위 들에 서 차이난다. 
RAID0 은 세번째 특성 을 지 원 하지 못한다. 

RAID 라는 말은 처음에 캘리포니 아 버클리종합대학의 한 연구집단에 의하여 발표되 
였다 [PATT88]. 3 론문에는 여러가지 RAID 구성과 응용을 소개하였으며 지금까지 리용되 
고 있는 RAID 준위들을 정의하였다. RAID 전략은 큰 용량의 디스크구동기를 다중화된 
보다 작은 용량구동기들로 바꾸고 다중구동기로부터 자료를 동시에 호출할수 있는 방법 
으로서 자료를 분리하였 다. 그리하여 성 능이 개 선되 고 용량효률을 높이 였 다. 

RAID 제안의 유일한 공헌은 과잉에 대한 요구를 효과적으로 론의한것이다. 비록 
동시 에 동작하는 여 러개의 자두와 수행기구들을 허 락하는것 이 더 높은 성능과 전송 
속도를 달성하지 만 여 러 개 장치 들을 리용하면 일 반적 으로 오유가 커 진 다. 믿 음성 이 
작아 지는것을 보상하기 위하여 RAID 는 디스크오유로 잃어 버리는 자료를 복귀하도 
록 하는 기 억된 기 우성 정보를 리용한다. 

이제 RAID 의 매 개 준위를 고찰하자. 표 5-2 에 7개 준위들을 개괄하였다. 물론 
2준위와 4준위는 상품화되지 못했으며 공업적으로 실현하는데 적합지 않다. 그럼에도 
불구하고 이 준위 들에 대 한 해 설은 일부 다른 준위 들에서 의 설계선택 을 도와 준다. 

그림 5_6 은 여유용량이 없는 4 개 디스크를 요구하는 자료용량을 지원하기 위하여 7 개의 
RAID 를 리용한 실례이다. 그림은 사용자자료와 여유자료를 구분하여 표시하였으며 관계되는 
여러 준위들에서의 기억기요구를 지적하였다. 다음론의를 통하여 이 그림을 따져 보자. 


2 추가적 인 준위들은 일부 연구사들과 일부 회 사들에 의하여 정의 되 였으나 이 절 에서 서 술한 7 개 준위 
들은 일 반적 으로 합의한것 이 다. 

3 이 론문에서 략자 RAID 는 Redundant Array of Inexpensive Disks (비용이 적은 디스크들의 여유배 
렬》로 표기된것이다. 비용이 적게 든다는 말은 하나의 큰 비용이 드는 디스크 ( SLED ) 대신에 RAID 에 상 
대적으로 비용이 적게 드는 작은 디스크들을 대비적으로 리용하였다. SL 티 D 는 물질적으로 RAID 와 비 
RAID 구성 들에서 리용되고 있는 류사한 디스크기술로 된 이전의 기 억기들이다. 그러므로 산업 에서는 
RAID 배렬이 충분한 성능과 믿음성의 증대를 강조한 독립성이라는 말을 씨왔다. 
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종류 

I 7 " 

위 

설명 

I/O 요구속도 
(읽기/쓰기) 

자료전송속도 
(읽기/쓰기) 

대표적인 

응용 

렬화 

0 

여유디스크없음 

큰 렬: 

가장 빠름 

작은 렬 : 

가장 빠름 

부차적인 자료에 대한 
고성능을 요구하는 
응용프로그람 

반사성 

1 

여유디스크에 자료반사 
보관 

빠름/중간 

느림/느림 

체계 구동장치:중요자료 

병렬호출 

2 

여유디스크에 하밍부호 
보관 

느림 

가장 빠름 


3 

여유디스크에 비트간 
기 우성 비 트보관 

느림 

가장 빠름 

화상처 리 ， CAD 와 같이 
방대한 I/O 처리를 
요구하는 응용프로그람 

독립호출 

4 

여유디스크에 블로크 
준위기우성블로크보관 

가장 빠름/중간 

중간/느림 


5 

여유디스크에 불로크 
준위분산형기우성 
블로크보관 

가장 빠름/중간 

중간/느림 

높은 요구속도，읽기강 
조，자료의 탐색 

6 

여유디스크는 불로크준위 
분산형 2 중기 우성 
블로크보관 

가장 빠름/느림 

중간/느림 

대단히 높은 가동능률 
을 요구하는 응용프로 
그람 


1. RAID 준우 I 0 


RAID 준위 0 은 성능개선을 위한 여유용량을 포함하지 않으므로 
성 원이 아니 다. 그러 나 성 능과 용량이 1 차적관심 사로 되 며 가격 을 
성을 높이는것보다 더 중요하게 제기되는 일부 슈퍼콤퓨터들에 약간 

RAID 0에 있어서 사용자와 체계의 자료들은 배렬형식으로 모든 
다. 이것은 하나의 큰 디스크를 리용하는 경우에 비하여 많은 우점을 
서 로 다른 \/0 요구가 서 로 다른 두개의 자료블로크들을 기 다리 고 있 p 
블로크들이 서로 다른 디스크에 있게 되는 좋은 기회가 생긴다. 따라서 
림시간을 줄이면서 병렬로 처리될수 있다. 

그러나 모든 RAID 준위들에서와 마찬가지로 RAID 0 은 디스크배목 
단히 분포하는것보다 더 진행된다. 즉 자료는 리용할수 있는 디스크들^ 
것은 그림 5-7 을 고찰하면 아주 쉽게 리해된다. 모든 사용자와 체계의 
크에 기 억된것으로 볼수 있다. 디스크는 줄별로 분할된다. 즉 이 줄들- 
분구, 기타 단위들일수 있다. 줄들은 련속적인 배렬성원들에 순환고리 
배 렬성 원들에 게 한개의 줄을 정 확히 그려 주는 론리적 인 련속줄묶음을 
개의 디스크배렬에서 첫 n 개의 론리적줄들은 물리적으로 매 n 개 디스 
억되여 첫 줄무늬를 형성한다. 즉 두번째 n 개의 줄들은 매개 디스크에 
억된다. 이 배럴의 우점은 가령 한개의 I/O 요구가 론리적으로 린접한 
보다 더 크다면 요구된 n 개이상의 줄들을 병렬로 조종하여 I / O 전송시간 




































그림 5-6. RAID 준위 

1-RAID 0( 초과디스크 없음), L-RAID 1( 초과디스크는 자료반사보관), n-RAID 
2( 초과디스크는 하밍부호보관), e-RAID 3( 초과디스크는 비트간 기우성 비트보관), 
a-RAID 4( 초과디 스크는 볼로크준위 기 우성 볼로크보관) , H-RAID 5( 초과디 스크는 
블로크준위 분산형 기 우성 블로크보관) , A-RAID 6(2 중초과디 스크 리 용) 

그림 5-7 에 는 론리 적디 스크공간과 물리 적디 스크공간사이 에 배 치 하기 위한 배 렬 관리프로 
그람의 리용을 보여 주었 다. 이 프로그람은 디 스크보조체 계 혹은 주콤퓨터 들에 서 집 행할수 
있 다. 

높은 자료전송능력을 위한 RAID 0 

모든 RAID 준위 들의 성 능은 주체계 의 요구페 런들과 그리 고 자료의 편성 에 결정 적으 
로 의존한다. 이 지 표들은 여 유량의 영 향이 분석과 서 로 간섭하지 않는 RAID 0 에서 가 
장 명 백하게 찾아 볼수 있 다. 첫째 로, 높은 자료전송속도를 얻 기 위한 RAID 0 의 리용을 
고찰한다. 높은 전송속도를 보기 위한 응용인 경우 두가지 요구가 제 기된다. 첫째 로，높 
은 전송능력은 주기억기와 개 별적 인 디스크구동기 들사이의 전반적 인 경 로를 통하여 실현 
되여야 한다. 이것은 내부조종기모선, 주체계 I/O 모선， I/O 접속기，주기억기모선을 포함한 
다. 

둘째로，응용이 디스크 배렬을 효과적으로 구동하는 I/O 요구들을 만들어 주어야 한 
다. 이 요구는 일반적요구가 렬의 크기에 비하여 론리적으로 련속적인 자료들의 량이 큰 
경 우에 만 제 기된다. 이 경 우에 단일 FO 명 령 요구는 여 러개의 디 스크 들로부터 병 렬 자료전 
송에 의해 초래 되 며 단일디 스크 전송에 비 하여 전송속도와 효률이 높다. 
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높은 I/O 요구속도를 위한 RAID 0 

동작적응환경 에 서 사용자는 일 반적 으로 전송속도보다도 응답시 간에 더 관심 을 가진 






다. 작은 자료량에 대 한 개 별적 I/O 요구인 경 우 I/O 시 간은 디 스크자두의 운동(람색 시간) 
과 디스크의 이동(회전지연)에 의하여 결정된다. 


론리적디스크 들리적디스크 0 들리적디스크 1 들리적디스크 2 ■ 리적디스크 3 



동작환경에서 초당 수백개의 I/O 요구들이 제기될수 있다. 디스크배렬은 여러개의 
디 스크들에 I/O 부하를 평 균화하여 분포함으로써 높은 I/O 집 행 속도를 얻 을수 있 다. 효률 
적 인 부하평 균화는 일 반적 으로 다중 I/O 의 독립 적 인 응용 혹은 여 러 개의 비 동기 적 인 I/O 
요구를 가질수 있는 단일동작적응환경이라는것을 암시한다. 성능은 또한 줄의 크기의 영 
향도 받는다. 줄의 크기가 비교적 크므로 한개의 I/O 요구는 오직 하나의 디스크호출만 
가지며 다른 한편 여 러개의 I/O 요구기 다림 은 병 렬로 조종되 여 매 요구에 대 한 기 다림시 
간이 줄어 들게 된다. 

2. RAID 준우 I 1 

RAID 1 은 여 유용량을 가지 고 있는 방법 인 2-6 까지의 RAID 준위 와는 차이 난다. 
RAID 1에서 여 유용량이 전체 자료를 2중화하는 간단한 방법 으로 리용되 는것 과 마찬가지 
로 다른 RAID 방법 들에 서 는 여 유를 도입 하기 위하여 일 부 기 우성계 산의 형 식 들이 리용 
된다면 RAID 1 에서는 여유가 모든 자료들을 복재하는 간단한 방책에 의하여 이루어 진 
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다. 그림 5-6 I • 에서 보여 주는바와 같이 RAID 0 에서 처 럼 자료를 줄로 배 치하는 방법 이 
리용되 였다. 그러 나 이 경 우에 모든 론리 적 줄들은 두개의 물리 적디 스크들에 배 치 되므로 
배렬된 매개 디스크들은 같은 자료를 포함하는 복사(반사)디스크를 가진다. 

RAID 1 구성 에 는 다음과 같은 여 러 가지 긍정할만한 측면들이 있 다. 

• 읽 기 요구는 요구하는 자료를 가지 고 있는 두개 의 디 스크들중 어 느 하나에 의하여 
봉사될수 있으며 어 느것 이 나 최 소탐색 시 간과 최 소회 전지연을 가진다. 

• 쓰기요구는 두개의 대응하는 줄들을 갱신할것을 요구하며 이것은 병렬로 진행될 
수 있다. 따라서 쓰기성능은 느린 두개의 쓰기동작 (실례 로 긴 람색시간과 지연시 
간을 가지는) 으로 주어 진다. 그러 나 RAID 1 에는《쓰기 반칙》이 없다. RAID 준 
위 2내 은 기 우성 비 트를 리용한다. 그러 므로 한개 의 줄이 갱 신될 때 배 렬 관리프로 
그람은 제 기된 실제줄을 갱 신할 때 에 먼저 기 우성비 트들을 계 산하고 갱 신한다. 

• 오유에 대 한 보정 은 간단하다. 구동기 에 서 오유가 발생되 였을 때 자료는 두번째 
구동기로부터 호출될수 있다. 

RAID 1 의 기 본결 함은 값이 비 싼것 이 다. 즉 RAID 1 은 자기 를 지 원하는 론리 적 디 스 
크의 2 배에 달하는 디스크공간을 요구한다. 왜냐하면 RAID 1 구성은 체계프로그람과 자 
료 그리고 다른 아주 중요한 파일들을 보관하는 구동기들에서 제 한을 받게 되기때 문이 다. 
이 경 우에 RAID 1 은 모든 자료들에 대 한 실 시 간여벌 복사를 보장함으로써 디 스크오유가 
있는 경우에 모든 중요한 자료들을 여전히 즉시에 리용할수 있게 한다. 

동작지향환경 에 서 RAID 1 이 많은 I/O 요구들을 읽 는다면 높은 I/O 요구속도를 달성할 
수 있다. 이 경우에 RAID 1 의 성능은 RAID 0 의 성능의 거의 2 배에 도달할수 있다. 그 
러나 만일 I/O 요구들의 중요한 부분이 쓰기요구를 가진다면 이때 RAID 0 에서는 충분한 
성능을 얻지 못할수 있다. RAID 1 은 또한 높은 읽기의 비률을 가진 자료전송이 많은 응 
용프로그람에 있어서 RAID 0 보다 개선된 성능을 보장할수 있다. 만일 응용프로그람이 
매개 읽기요구를 분할하여 두개의 디스크성원들이 참가하도록 한다면 성능이 개선된다. 

3. RAID 준우 I 2 

준위 2 와 3 의 RAID 는 병 렬호출기능을 리용한다. 병 렬호출배 럴에서 모든 디 스크들 
은 다 I/O 요구들의 집행에 참가한다. 일반적으로 개별적인 구동축들이 동기화되므로 모 
든 디스크자두들은 임의의 주어 진 순간에 매 디스크들의 갈은 위치에 있다. 

다른 RAID 방법 들에서처 럼 자료를 줄로 배 렬하는 방법 을 리용한다. 준위 2 와 3 의 
RAID 인 경우에 줄들은 매우 작으며 흔히 lbyte 혹은 한단어로 주어 진다. RAID 2 에서 
오유수정부호는 매 자료디스크에서 해당하는 비트전체에 대하여 계산되며 부호의 비트들 
은 다중기 우성 디 스크상의 해 당하는 비트위 치들에 기 억 된다. 일 반적 으로 단일 비 트오유들 
을 수정하고 2중비트오유를 검사하는데 하밍부호가 리용된다. 

비록 RAID 2 가 RAID 1 보다 디스크수를 적게 요구하지만 여전히 비용이 많이 든다. 
여유디스크수는 자료디스크수의 로그에 비례한다. 한번의 읽기에서 모든 디스크들은 동 
시 에 호출된다. 요구된 자료와 관련되는 오유수정부호는 배 렬조종기 에 전송된다. 만일 단 
일 비 트오유가 있 다면 조종기 는 즉시 에 응답하고 오유를 수정할수 있 으며 따라서 읽 기 호 
출시간은 떠 지 지 않는다. 한번의 쓰기 에 서 모든 자료디 스크들과 기 우성디 스크들이 쓰기 
조작에 호출되 여 야 한다. 

RAID 2 는 디 스크오유가 많이 발생하는 환경 에서만 효과적 으로 리용될수 있다. 
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개별적인 디스크들과 디스크구동기들의 믿음성이 높으면 RAID 2 는 필요 없으며 실 
현하지 않는다. 


4. RAID 준우 I 3 

RAID 3 은 RAID 2 와 비슷한 형식으로 구성된다. 차이점은 RAID 3 이 하나의 여유 
디스크만을 요구한다는것 이며 얼마나 큰 디스크배 렬 이 있어 야 하는가 하는 문제는 제 기 
되지 않는다는것이다. RAID 3 은 작은 줄들로 분할된 자료에 대하여 병렬호출을 채용한 
다. 오유수정부호대 신에 간단한 기 우성비 트가 모든 자료디 스크들의 같은 위 치 에서 개 별 
적인 비트들의 묶음을 계산한다. 

여유 

장치 오유인 경 우에 기 우성 구동기 가 호출되 며 자료는 나머 지장치들로부터 재 구성 된 
다. 일 단 오유가 발생한 구동기 가 교체 되 면 잃 어 버 린 자료는 새 구동기 에 다시 기 억 시 
킬수 있으며 조작은 다시 진행된다. 

자료의 재 구성 은 아주 간단하다. X0-X3 이 자료를 포함하고 X4 가 기 우성디 스크인 
5 개 구동기의 배 렬을 고찰하자. / 번째 비 트에 대 한 기 우성 은 다음과 같이 계산된다. 


X4(i) = X3(i) ® X2(i) ® Xl(i) ® X 0(/) 


XI 구동기 가 오유를 나타냈다고 가정 하자. 만일 웃식의 량변에 X4(i 》 ®Xl(i 》 를 더하면 
다음과 같이 된다. 

Xl _ = X 4(0 ® X 3( i ) ® X 2( i ) ® XO(i), 

따라서 XI 에서 자료의 매 개 줄들의 내 용은 배 렬에 있는 나머지디스크들에 있는 대응 
하는 줄들의 내용으로부터 재 발생할수 있다. 이 원리는 RAID 준위 3~6 에서도 모두 
같다. 

디스크오유인 경우 모든 자료는 축소방식을 리용한다. 이 방식 에서 읽기인 경우 잃 
어버린 자료는 안맞음론리합계산에 의하여 재생된다. 자료가 축소된 RAID 3 배렬에 쓰 
기될 때 기우성생성은 후에 재생할수 있어 야 한다. 충분한 조작이 되돌려 지 자면 오유디 
스크가 재배치되고 오유디스크의 전체 내용이 새로운 디스크에 재생되여야 한다. 

성능 

자료가 대단히 작은 줄들로 분할되므로 RAID 3 은 대단히 높은 자료전송속도를 얻 
을수 있다. 임의의 I/O 요구는 모든 자료 디스크로 부터 병렬자료전송을 가질수 있다. 큰 
전송들에서 성능개선은 특별히 두렷하다. 다른 한편 하나의 I/O 요구만은 단번에 집행할 
수 있다. 따라서 동작지향환경에서 성능은 무시될수 있다. 

5. RAID 준우 I 4 

RAID 준위 4~6은 독립적인 호출기능을 리용하였다. 독립적인 호출배렬에서 매개 디 
스크부분들은 독립적으로 동작하므로 분할된 I/O 요구는 병렬조작을 만족할것이다. 이것 
으로 인하여 독립적인 호출배렬은 높은 I/O 속도를 요구하는 응용들에 더 적합할수 있으 
며 높은 자료전송속도를 요구하는 응용들에 상대적으로 적합하지 못하다. 

다른 RAID 방법들에서와 마찬가지로 자료분할방법을 리용한다. RAID 준위 4-6 의 
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경우에 줄들은 상대적 으로 크다. RAID4 에서 기우성 비트배 렬 (bit-by-bit parity》 렬은 매개 
자료디 스크에 서 대 응하는 줄들에 대 하여 계 산하며 기 우성비 트들은 기 우성디 스크상에 대 
응하는 줄로 기억된다. 

RAID 4는 작은 용량의 I/O 쓰기요구가 수행될 때 반칙을 가진다. 쓰기가 발생할 때 
마다 배 렬관리프로그람은 사용자자료뿐아니 라 대 응하는 기 우성비 트들로 갱 신되 여 야 한다. 
X0-X3 이 자료를 포함하고 X4 가 기 우성 디스크인 5 개 구동기의 배 렬을 고찰하자. 쓰기 
가 디스크 XI 의 줄에 대해서만 수행된다고 가정한다. 처음에 매 비트에 대하여 다음과 
같은 관계 가 성 립한다. 


X4(i) = X3(i) ® X2(i) ® Xl(j) ® X0(/) 


갱 신후에 될수록 변화된 비트들은 처 음의 부호에 의하여 지적된다. 

X4'(0 = X3(0 ® X2(i) ® X1'(0 e X0(/) 

= X3 ⑴ ® X2(i) ® XI’ (/) ® XO ⑴ ® XI ⑴ ® Xl(j) 

= x4(o©xi(/)©xr(/) 

새로운 기우성을 계산하기 위하여 배렬관리프로그람은 낡은 줄들과 낡은 기우성줄들을 
읽어야 한다. 그다음 새로운 자료와 새롭게 개선된 기우성을 가진 이 두개의 줄들을 갱 
신한다. 따라서 매개 줄쓰기는 두번의 읽기와 두번의 쓰기를 가진다. 

모든 디스크들이 줄들을 모두 포함하는 더 큰 용량의 I/O 쓰기인 경우에 기우성은 
새 자료비트들만을 리용하여 계산함으로써 쉽게 계산된다. 따라서 기우성구동기는 자료 
구동기 들에 서 병렬로 갱 신할수 있으며 확장된 읽기나 쓰기는 없다. 

임의의 경우에 모든 쓰기조작은 기우성디스크를 호출하며 따라서 성능제한현상이 
나타날수 있다. 

6. RAID 준우I 5 

RAID 5는 RAID 4와 류사한 형태로 구성된다. 차이는 RAID5 는 모든 디스크들에 
기 우성줄들을 분할한것 이 다. 표준적배 치는 그림 5-6 H 에서 지 적된 순환고리방법 이 다. N 
개의 디 스크배 럴 에 대 하여 기 우성 줄은 첫 n 개의 줄들에 대 하여 서 도 다른 디 스크들에 존 
재하며 그다음 패런들은 반복된다. 

모든 구동기에 대 한 기우성분할은 RAID4 에서 나타나는 I/O 성능제한현상을 
피하게 한다. 

7. RAID 준우I 6 

RAID 6 은 머클리 연구소의 소론문에 소개되 였 다 [KAT89]. RAID 6 에서 두개의 서 로 다 
른 기 우성 계 산들은 서 로 다른 디 스크들에 분리 된 블로크들을 전송하고 기 억 한다. 따라서 
사용자자료가 자 개 의 디 스크들을 요구하는 RAID 6 배 렬 은 N+2 개 의 디 스크들로 구성 된 다. 

그림 5-6 A 에서 이 방법 을 설명해 보자. P 와 Q 는 두개의 서 로 다른 자료검 사알고 
리 듬들이다. 도중의 하나는 RAID 준의 4와 5 에서 리 용된 알맞음론리 합계산이 다. 그러 나 
다른 하나는 독자적 인 자료검사알고리 듬이 다. 이것은 두개의 디 스크가 사용자자료오유를 
가질 때 자료를 재 생할수 있 게 한다. 
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RAID 6 의 우점은 아주 높은 자료리용률을 준다는것 이 다. 3 개의 디스크들은 자료가 
리용될 수 없게 하는 MTTR 시 간안에 오유를 가질 수 있 다. 다른 한편 RAID 6 은 중요한 
쓰기반칙 을 나타낼수 있는데 그것은 매 개 쓰기 가 두개의 기우성 블로크에 영 향을 미 치기 
때문이다. 


제 3 절. 빚기억기 

1983 년에 일찌기 없었던 가장 성공적인 소비제품의 하나인 고밀도디스크수자음성체 
계가 도입되였다. CD 는 한면에 60 분이상의 많은 음성정보를 기억할수 있는 지울수 없는 
디 스크이 다. CD 가 도입 됨 으로써 콤퓨터자료기 억 분야에 서 혁 신으로 되 는 저 가격 빛디 스크 
기 억기술을 개 발할수 있게 하였다. 여 러 가지 빛 디 스크체 계를 표 5-3 에 소개하였다. 이것 
들을 간단히 고찰하자. 

1. CD-ROM 

음성 CD 와 CD-ROM (Compact Disk Read-Only Memory ) 은 모두 비 슷한 기 술을 가진 
다. 기본차이는 CD-ROM 구동기가 더 견고하며 자료가 디스크로부터 콤퓨터로 정확히 
전송되도록 오유수정장치를 가지고 있다는것 이 다. 두 형 태의 디 스크들은 다 같은 방법으 
로 만든다. 디 스크는 폴리카보네 트와 같은 수지 로 이 루어 져 있 으며 보통 알루미 니움과 
같은 센 반사면으로 씌 워 져 있 다. 수자적 으로 기 록된 정 보 (음악이 나 콤퓨터자료)는 반 
사면우에 현미경적인 작은 구멍들로 찍히운다. 이것은 우선 디스크본관을 만들기 위해 
높은 출력의 레이 자로 초점 을 정밀하게 맞추는 방법 으로 진행된다. 그다음 디스크본판은 
복제 물로 찍 어 내 기 위 한 형타를 만드는데 리 용된 다. 복제 물의 구멍 이 찍 힌 표면은 맑은 
락카로 피 복하여 먼지 와 긁히우는것 을 막는다. 

표 5-3. 빛디스크제품 


CD 

고밀 도4建크. 수자식 음성 정보를 기 억하는 지 울수 없는 디 스크이 다. 표준체 계 는 
12 cm 디 스크를 사용하며 련속적 인 동작으로 60 분이 상 되 는 자료를 기 록할수 있다. 

CD-ROM 

읽기전용기억기인 고밀도디스크. 콤퓨터자료를 기억하는데 리용하는 지울수 없는 기억기. 표 
준체 계 는 12 cm 디 스크를 사용하며 600 Mbyte 이 상 기 록할수 있 다. 

DVD 

수자식 비 데오디 스크. 제 작기 술은 용량이 큰 수자식자료뿐아니 라 압축된 비 데오정보를 수자화 
한다. 

WORM 

한번 쓰고 여러번 읽기디스크. CD-ROM 보다 더 쉽게 씌여 지는 디스크. 한번의 복사를 하여 
상품화할수 있다. CD-ROM 과 마찬가지로 쓰기조작이 진행된후에 디스크는 오직 읽을수만 있 
다. 가장 일반적인 크기는 5.25 inch 인데 200 Mbyte 〜 800 Mbyte 까지의 자료를 기록할수 있다. 

Erasable Optical Disk 

이 디스크는 빛기술을 리용하였지만 쉽게 지우고 다시 쓰기할수 있다. 3.25 inch 와 5..25 inch 
디스크가 쓰인다. 일반적으로 용량은 650 Mbyte 이 다. 

Magneto Optical Disk 

이 디스크는 읽기 위한 빛기술과 빛초점을 조절하는 자기적기록기술을 리용하였다. 

3.25 inch 와 5.25 inch 디스크가 쓰인다. 용량은 흔히 1 Gbyte 이상이다. 
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정 보는 빛 디 스크구동장치 안에 서 조여 지 는 작은 출력 의 레 이 자에 의 하여 CD 나 
CD-ROM 으로부터 읽히워 진다. 레이 자는 전동기 가 디스크를 돌리 여 레이 자빛을 받게 
하였을 때 맑은 보호표면을 거 쳐 조여 진다. 구멍부분에서 반사되는 레이 자빛의 세 기는 
다르다. 수감기는 이 변화를 수감하며 수자신호로 변환한다. 

회 전하는 디 스크우의 중심가까이 있는 구멍 은 바깥쪽의 구멍 보다 더 천천히 고정된 
점 (레이 자빛 과 갈은) 을 지나며 따라서 레이 자가 모든 구멍 들을 갈은 속도로 읽 을수 있도 
륵 속도의 변동을 보상할수 있는 몇 가지 방법 이 있다. 이것은 자기디스크와 같이 디스크 
토막들에 기록된 정보비트사이의 공간을 늘임으로써 실현할수 있다. 등각속도 ( CAV ) 의 
고정된 속도로 디스크를 회 전시 킴 으로써 정보를 같은 속도로 읽을수 있다. 그림 5-8 자 에 
CAV 를 리 용한 디스크의 설계를 보여 주었다. 디스크는 많은 분구들로 나누어 지며 동심 
원의 자리 길들로 나누어 진다. CAV 를 리용하는 우점 은 개 별적 인 자료블로크들이 자리길 
과 분구들로 직접 주소화될수 있다는것이다. 현재위치로부터 지적된 주소로 자두를 이동 
하기 위해 지 적된 자리 길 에 로의 자두의 순간이동과 자두아래 에 서 돌아 가는 지 적된 분구 
를 위한 짧은 대기가 있다. CAV 의 결함은 긴 바깥자리길에 보관될수 있는 자료의 량이 
짧은 안쪽자리길에 보관될수 있는 자료의 량과 같은것 이 다. 



기 ) L) 

그림 5-8. 디스크편성방법의 비교 
*1-" 봉각속도 (CAV) 私-등속선형속도 (CLV) 

CAV 방법 은 디 스크의 바깥쪽에 는 적 은 량의 정 보밖에 기 억할수 없 으므로 많은 공간 
을 랑비하기 때 문에 CD 와 CD-ROM 에 리용되 지 않는다. 반대 로 정 보를 같은 크기 의 토막 
들로 묶으면 이 것 들은 부등속도로 회 전 하는 디 스크에 의해 갈은 속도로 주사된 다. 구멍 
들은 일정한 선속도 ( CLV ) 로 레이 자에 의하여 읽 어 진다. 디 스크는 중심 으로부터 멀 리 
있는 호출일수록 더 천천히 회전한다. 이 렇게 자리길의 용량과 회전지연은 바깥쪽으로 
가면서 증가한다. 

여 러 가지 밀도를 가진 CD-ROM 들이 생 산되 고 있 다. 표준디 스크의 자리 길 과 자리 길 
사이의 공간은 1.6/ an (1.6 Xl ( r 6 m ) 이다. CD - ROM 의 기록할수 있는 자리길의 수는 32.55 
mm 의 반경 을 자리길공간으로 나누어 보면 알수 있는데 결국 20344 개의 자리길 이 있는것 
으로 된다. 사실상 하나의 라선형자리길이 있는데 이것은 라선의 회전수로 평균원의 둘 
레를 곱하는 방법으로 그 자리길의 길이를 구할수 있으며 이것은 약 5.27 km 로 계산된다. 
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CD-ROM 의 주어 진 선속도는 1.2 %이므로 자리길을 한번 지나가는에 총 4391s 즉 
73.2min 걸리며 이것은 음성 CD 에 표준적인 최대 동작시간과 비슷하다. 자료가 
176.4kbyte/s 의 속도로 디스크로부터 흐르기 때문에 CD-ROM 의 기 억용량은 774.5Mbyte 
이 다. 이것은 550개의 3.25inch 플로피 디스크의 용량과 맞먹는다. 

CD-ROM 의 자료는 련속적 인 블로크로 이루어 진다. 표준블로크형 식을 그림 5-9 에 
보여 주었다. 이것은 다음의 마당으로 이루어 진다. 

• 동기 : 동기 마당은 블로크의 시 작을 식 별 한다. 그것 은 모두 0 으로 된 lbyte 와 모 
두 1로 된 lObyte 그리 고 모두 0 으로 된 lbyte 로 구성 되 여 있 다. 

• 머 리 부: 머 리 부는 블로크주소와 방식바이 트를 가진 다. 방식 0 은 공백자료마당을 
지 정 한다. 방식 1 은 오유수정 부호와 2048byte 의 자료의 사용을 지 정 하며 방식 2 는 
오유수정 부호가 없는 2336byte 의 사용자자료를 지 정한다. 

• 자료: 사용자자료 

• 보조량: 방식 2 에 따르는 추가적 인 사용자자료이 다. 방식 1 에서 이것은 288byte 의 
오유수정 부호이 다. 

그림 5-8 L 는 CD 와 CD-ROM 에 사용된 등선속도방식의 배 치를 보여 준다. CLV 사 
용으로 자유호출이 더 힘들어 진다. 지적된 주소를 알아 내자면 해당한 범위로 자두를 
이 동시키 고 회 전속도를 조절하며 주소를 읽 은 다음 지 적된 분구를 찾고 호출하기 위한 
세 부적 인 조종을 진행하여 야 한다. 

CD-ROM 은 많은 사용자들이 많은 량의 자료를 서술하게 하는데 합리적 이 다. 초기 
쓰기공정 에서 많은 비 용을 요구하기 때 문에 개 별적 인 응용에 는 적 합지 않다. 전통적 인 자 
기디 스크와 비 교해 보면 CD-ROM 은 다음의 3가지 우점 을 가진 다. 

• 정 보기 억 용량은 빛디 스크가 훨씬 더 크다. 

• 빛디스크는 자기디스크와 달리 거기 에 기 억된 정 보들을 값 눅게 다량 재현할수 
있 다. 자기디 스크상의 자료기 지 는 두 디 스크구동기 를 리용하여 한번 에 하나의 디 
스크복사하는 방법 으로 새끼친다. 

• 빛디스크는 넣었다꺼냈다할수 있기때문에 많은 량의 정보자료를 디스크채로 축적 
해 두는데 리용할수 있다. 대부분의 자기디스크는 넣 었다꺼 냈다할수 없다. 넣 었다 
꺼 냈다할수 없는 자기디 스크상의 정 보는 디 스크구동기 나 디 스크가 새 정 보를 보 
관하는데 리용할수 있 도륵 하기 에 앞서 우선 레 프에 복사하여 야 한다. 

CD-ROM 의 결 함은 다음과 같다. 

• 읽기만 하고 갱신할수 없다. 

• 자기디 스크구동기 보다 0.5s 정 도의 더 긴 호출시 간을 가진 다. 




2. WORM 


자료묶음에 대한 한번 혹은 여러번의 복사를 요구하는 응용을 위하여 한번의 쓰기 
와 여러번의 읽기를 진행하는 CD 가 개발되였다. WORM (Write-Once Read-Many) 에서 디 
스크는 적 당한 세 기의 레 이 자빛으로 한번 더 쓰기 할수 있다. 그러므로 CD-ROM 보다 더 
비싼 디스크조종기를 가지고 사용자는 읽기와 마찬가지로 한번은 쓰기할수 있다. 더 빠 
른 호출을 얻 기 위하여 WORM 은 일부 용량이 손실되 는 CAV 방식 을 리용한다. 

디 스크를 만드는 표준기 술은 디 스크우에 기 포들을 형성시키 는데 높은 출력의 레 이 
자를 리용하는것이다. 미리 형식화된 매체가 WORM 구동기에 자리잡았을 때 작은 출력 
의 레이 자가 충분한 열을 내 여 이미 기록된 기포들을 터칠수 있다. 디스크읽기조작이 진 
행될 때 에 WORM 구동기 에서는 레이 자가 디스크표면을 비친다. 터진 기포들이 그 주변 
과 높은 대 조를 이 루기 때 문에 이 것 들이 간단한 전자장치 에 의하여 쉽 게 인식 된다. 

WORM 빛디 스크는 문서 나 파일을 기 억시키는데 많이 쓴다. 이것은 많은 량의 사용 
자자료를 영구보관하는데도 쓰인다. 

3. 지울수 있는 빚디스크 

지울수 있는 빛디스크는 임의의 자기디스크와 같이 반복적으로 쓰기와 덧쓰기를 할수 
있다. 비록 많은 연구가 진행되였지만 순수 광학적방법 (앞에서 론의된 자기광학적방법과 
대치되는)만을 상변환방법이라고 한다. 상변환디스크는 두개의 각이한 상태에서 크게 차이 
나는 두가지 반사능을 가지는 재료를 리용한다. 여기에는 분자들이 무질서하게 운동하며 
빛을 잘 반사하지 않는 무정형상태 그리고 빛을 잘 반사하는 매끈한 표면을 가진 결정상 
태 가 있다. 레 이자빛묶음은 재료를 한상으로부터 다른 상으로 변화시 킬수 있다. 상변환빛 
디스크의 본질적인 결함은 재료들이 자기의 요구되는 성질을 때때로 영구적으로 잃어 버 
린다는것 이 다. 현재 리용하고 있는 재료들은 500,000〜1,000,000회 지울수 있다. 

지 울수 있 는 빛 디 스크는 CD-ROM 과 재 쓰기 할수 있 는 WORM 에 비 하여 고유한 우 
점 을 가지며 2 차기억기 로 리 용된다. 그러 므로 이 것은 자기디 스크와 비숫하다. 자기디스 
크에 비한 지 울수 있는 빛디 스크의 본질적 인 우점 은 다음과 같다. 

• 큰 용량: 5.25 inch 빛디스크는 약 650 Mbyte 의 자료를 기 억할수 있다. 대부분 현 
대적인 원체스터디스크는 이 용량의 절반이하이 다. 

• 이 동성 : 빛디 스크는 구동기 에 서 떼 낼수 있 다. 

• 믿음성 : 빛 디스크에 대 한 공학적 인 허 용오차는 큰 용량의 자기디스크보다 훨씬 작 
다. 그러므로 그것들은 더 높은 믿음성과 더 긴 수명을 보장한다. 

지 울수 있 는 빛 디 스크에 서 는 WORM 에 서 처 럼 CAV 방법 을 리 용한다. 

4. 수자식비데오디스크 

용량이 큰 수자식비데오디스크 (DVD) 가 개발됨으로써 전자공업부분에서는 드디여 
상사식 VHS 비 데 오레 프를 교체 할수 있게 되 였 다. DVD 는 비 데 오카세 트록화기 (VCR) 에 
사용된 비데오레프대신에 리용할수 있으며 여기서 더 중요한것은 이것을 개인용를퓨터와 
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봉사기 에 서 CD-ROM 대 신에 리용할수 있 다는것 이 다. DVD 는 수자시 대 의 비 데오이 다. 그 
것은 화상질이 높은 영화를 보존하며 DVD 구동기에서도 동작할수 있는 음성 CD 와 같이 
자유로 호출할수 있다. CD-ROM 보다 실지 로 7 배 에 달하는 방대 한 량의 자료를 기 록할 
수 있다. DVD 의 방대한 기억용량과 선명한 질로 개인용콤퓨터에 의한 오락은 더 생동 
하게 될것 이 며 교육프로그람은 더 구체 적 인 비 데오로 형 상될 것 이 다. 이 발전으로 하여 
Web 싸이 트에 소개 되 는 실물이 아닌 제 품들로 인터네 트와 집 합인트라네 트를 통한 상품 
거래가 진행되는 새로운 양상이 이루어 졌다. 

여기 에 CD-ROM 과 DVD 가 구별되는 가장 중요한 점 이 있다. 

• 표준 DVD 는 층마다 4.7Gbyte 를 기 억 하며 한방향쌍층 DVD 는 8.5Gbyte 를 기 
억 한다. 

• DVD 는 높은 질의 완전화면그림 에 대 하여 MPEG 라고 하는 비 데오압축형 식 을 
사용한다. 

• 단일층 DVD 는 2 시간 30 분짜리 영화를 기억할수 있고 한편 쌍층 DVD 는 4 시간 
이 상되 는 영 화를 기 억할수 있 다. 

5. 자기빚디스크 

자기 빛 (MO) 디 스크구동기 는 일 반적 으로 쓰이 는 자기 디 스크체 계 의 능력 을 높이 는데 
빛레 이자를 사용한다. 기록기술은 근본적으로 자기적이다. 그러나 빛레 이자를 자기기록머 
리부의 초점 을 맞추는데 효과적 으로 리용함으로써 더 큰 가능성 을 얻 게 되 였 다. 여 기서 
디 스크는 높은 온도에 서 만 극성 이 변화되 는 물질 로 피 복되 여 있다. 정 보는 그 표면우에 
있는 미세한 점 을 가열 하는데 레이 자를 리용하고 다음 자기마당을 가함으로써 디 스크우 
에 씌여 진다. 그 점이 식으면서 자기마당의 북남량극을 취하게 된다. 분극공정이 디스크 
우에 서 물리 적변화를 일 으키 지 않기 때 문에 처 리 공정 은 몇번 반복할수 있 다. 

읽 는 작용은 순수 빛 으로 진행한다. 자력 선의 방향은 분극된 레이 자빛(쓰기조작 
에서 보다 더 적 은 출력 )에 의해 검 출된다. 특수한 점 에서 반사되 는 분극된 빛은 자기 
마당방향에 의존하는 그의 회전정도를 변화시킬것이다. 

순수한 빛 CD 구동기 에 비 한 MO 구동기 의 기 본적 인 우점 은 디 스크의 수명 이 다. 
빛디스크에 대한 자료의 반복적인 다시쓰기는 매체를 점차적으로 파피시킨다. MO 구 
동기 는 이 런 파괴 가 없 으므로 반복적 인 다시쓰기 를 계 속할수 있다. MO 기 술의 다른 
우점은 그것 이 자기기 억기보다 Mbyte 당의 값이 아주 눅은것 이 다. 

제 4 절.자기테프 

레프체계에서는 디스크 체계에서와 같은 읽기와 기록기술을 리용한다. 매체는 자성산 
화물로 덮 인 녹신녹신한 마일 라레 프이 다. 레 프와 테 프구동기 는 가정 용록음기 레 프기 록체 
계와 류사하다. 

레프매체는 작은 수의 평행자리길들로 구성되여 있다. 초기에 나온 레프체계는 표준 
적 으로 9개 자리 길을 사용했 다. 이것은 한번에 lbyte 의 자료를 기 억할수 있으며 9번째 
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자리길로서 보충적인 기우성비트를 가지고 있다. 더 새로운 레프체계에서는 하나의 수자 
단어 혹은 배단어 에 해 당하는 18 혹은 36 자리길을 사용한다. 디스크에서 처 럼 자료는 테 
프우에서 물러 적레 부호라고 하는 린접블로크에서 읽기 되고 쓰기된다. 레프우의 블로크들 
은 기록사이 간극에 의하여 갈라 져 있다. 그림 5-10 은 9개의 자리 길을 가진 레 프의 구 
조를 보여 준다. 디스크에서처 럼 레 프는 자리잡은 물리 적레코드를 알아 내 는데 도움이 
되도록 형식화되여 있다. 

레 프구동기 는 순차호출장치 이 다. 만일 테 프머 리 부가 레 코드 1 에 위 치하면 그다음 
레 코드 N 을 읽 기 위 해 서 는 N -1 을 통해 단번 에 하나씩 물리 적 레 코드 1 을 읽 어 야 한다. 
만일 머 리부가 요구되 는 레 코드경 계밖에 위 치 하고 있 다면 일정한 길 이 만큼 테 프를 다 
시 감고 앞으로 읽 어 나가기 시작하여야 한다. 디스크와 달리 테프는 오직 읽거 나 쓰 


자리길 1 
자리길 2 
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그림 5-10. 9 개 자리 길의 자기 디 스크형 식 


기 조작하는 동안만 이 동상태 에 있다. 

레 프와는 대 조적 으로 디 스크구동기 는 직 접 호출장치 라고 한다. 디 스크구동기 는 요구하는 자 
료를 얻기 위하여 디스크우의 모든 분구를 차례로 읽을 필요가 없다. 그것은 오직 한 자리길안 
의 분구에 끼여 들어 가는것만 대기하여야 하며 임의의 자리길에 대한 련속 호출을 할수 있다. 

자기테 프는 보조기억기의 첫 종류였다. 자기레 프는 여 전히 기 억기계층에서 값이 가 
장 눅고 속도가 가장 느린것으로서 널리 쓰이고 있다. 

참고문헌과 Web 싸이트 

[ MEE 96 a ] 은 디 스크와 레 프체 계 의 레 코드화기 술을 기 본적 으로 개 괄하였 다. 
[ MEE 96 b ] 는 디스크와 레프체계 에 대 한 자료기 억기술을 기본으로 취급하였다. 

RAID 개 념 의 발명 가들에 의 하여 작성 된 RAID 기 술의 우수한 개 괄은 [ CHEN 94] 에 
서 주었다. 더 자세한 론의는 RAID 제품에 대한 공급자와 구입자들의 련합인 RAID 자문 
기 구에 의하여 공개 되 였 다 [ MASS 97]. 최 근 가장 좋은 연구론문은 [ FRIE 96] 이 다. 

[ MARC 9()] 은 빛기억분야의 좋은 고찰을 주었다. 기본적인 기록과 읽기기술에 대한 
개괄은 [ MANS 9 기에서 주었다. 

마지 막으로 [ ROSC 9 기은 개 별적 인 장치들에 대 한 상세한 기술의 전부로서 외부기 억 
체계의 모든 형태를 폭 넓게 고찰하였다. 
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Web 싸이 트: 

• RAID 자문기 구 : RAID 산업 그롭 


련습문제 


1. 디스크체 계 에 대 하여 다음것을 정의 하시오 . 

4 - 탐색시 간 ; 자리 길우의 자두가 자리를 잡는데 걸 리는 평균시간 
r - 디스크의 회전속도 ; 초당 회전수 
n - 분구당 비트수 
N - 자리길의 용량 ; 비트 
tp、 - 분구호줄시 간 

다른 지 표들의 함수로서 의 t A 에 관한 식 을 전개하시 오 . 

2. 10 - 구동기 RAID 의 구성 을 가정 하자 . 다음란들을 채 우고 여 러 가지 RAID 준위를 
을 비교하시오 . 


RAID 준위 

기억밀도 

대역너비성능 

취급성능 
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매 지표들은 가장 좋은 성 능을 내는 RAID 준위 로 표준화되 였다. 그러므로 란에 
남아 있는 수들은 0과 1사이의 값을 가져 야 한다. 기 억기의 밀도란 사용자자료 
를 디 스크기 억 기 의 능력 으로 나눈 값을 말한다. 띠너 비 성 능은 자료가 얼 마나 
빠른 속도로 배렬밖으로 전송될수 있는가를 반영한다. 처리성능은 한 배렬이 
초당 얼마나 많은 I/O 조작을 수행할수 있는가 하는 척도이 다. 

디스크줄짓기는 줄크기 가 VO 요구크기 에 비 하여 작을 때 에 자료전송속도를 높 
일수 있다는것을 설명 하시오. 또한 RAID 0은 다중 ！/ O 요구는 병 렬로 조종될수 
있기때 문에 단순한 큰 디 스크에 비 하여 높은 성 능을 보장한다는것 을 설명하시 
오. 그러 나 이 두번째 문제 에 서 디 스크줄짓 기 가 필요하겠는가?즉 디 스크줄짓 기 
가 줄짓 기 가 안된 대 비 디 스크배 렬 에 비 하여 VO 속도성 능을 높이 겠는가? 

레프속도가 초당 120 inch 이고 레프밀도가 인치당 1600 bit 인 자기레프장치의 9 
자리길 자성테 프의 전송속도는 얼 마인가? 

2400 ft ( lft =30 cm ) 의 레프 한틀이 있다고 하자. 

레코드사이간극은 0.6 inch , 레프의 속도는 간극이 선형적일 때 증가 또는 감소 
한다. 그리고 레프의 다른 특성들은 문제 4 번에서와 같다. 레프우의 자료들은 
물리 적 레 코드로 구성 되 여 있 으며 매 물리 적 레 코드는 론리 적 례 코드라고 하는 고 
정적 인 사용자정의단위수를 포함하고 있다. 

- I . 물리적 레코드 하나당 10 개씩 블로크화된 120 byte 론리적 레코드의 전체 레 프 
를 읽는데 얼마만한 시간이 걸리겠는가? 

물리 적 레 코드 하나당 30 개 씩 블로크화된 120 byte 론리 적 레 코드의 전체 레 프 
를 읽는데 얼마만한 시간이 걸리겠는가? 
n . 앞에서 말한 블로크화인자들을 가진 레 프가 얼마나 많은 론리 적레 코드들을 유 
지하고 있겠는가? 

h . 앞에서 말한 2개의 블로크화인자들에 관하여 총 유효전송속도는 얼마이겠는가? 
n . 레프의 용량은 얼마인가? 

만일 디 스크가 512 byte / 분구，96분구/자리 길，110 자리 길/면의 고정 분구식 이 고 
8 개의 사용가능한 면을 가지 고 있다면 문제 5번의 l 에서 읽 은 론리 적레코드들 
을 기억하는데 디스크공간(분구，자리길，면)이 얼마나 요구되는가를 계산하시 
오. 임의의 파일머리부레코드와 자리길첨수를 무시하고 레코드들은 한 분구이상 
회전할수 없다고 가정하시오. 



체 계 모선 
대면부 


제 6 장. 입출력 


외부장치 
대면부 


자료선 


주소선 

조종선 



자료 

상래 

조종 


자료 

상태 

조종 
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♦ 콤퓨터 체 계 의 FO 기 본방식 은 외 부세 계 와의 대 면부이 다. 이 기 본방식 은 외 부세 계 와 
의 호상작용을 조종하는 체 계 수단을 제 공하며 I/O 작용을 효과적 으로 관리하는데 요 
구되는 정보를 조작체계에 제공하도록 설계된다. 

♦ 다음과 같은 세가지 기본 !/ O 기술이 있다. 프로그람식 I/O 에서는 I/O 조작을 요구하 
는 프로그람의 직접 및 련속조종하에서 I/O 조작이 진행된다. 새치기구동식 I/O 에서 
는 프로그람이 I/O 지 령을 출력 하고 VO 조작의 끝을 알려 주는 1/0 하드웨 어 에 의 하 
여 중단될 때 까지 실행 이 계속된다. 직접기 억기접근 ( DMA ) 은 전용 !/0 처 리 장치 가 
큰 자료블로크를 이 동시키 는 I/O 조작을 조종한다. 

♦ 외부 ]/ O 대면부의 대표적 인 실례 에는 SCSI 와 FireWire 의 두가지 가 있다. SCSI 는 외 
부장치 에 대 한 병 렬대면부이며 한편 보다 새로운 FireWire 는 고속직 렬대면부이다. 

♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦ 

처리장치와 기억기모둘묶음외에 를퓨터체계의 세 번째 주요요소는 I/O 모둘묶음이 다. 
매 장치 는 체 계 모선 이 나 중심 스위 치 들에 접 속되 여 하나이 상의 주변장치 들을 조종한다. 
I/O 모둘는 단순히 체계모선에 장치를 련결시키는 기계적련결기들의 묶음이 아니다. 오히 
려 I/O 모둘는 일련의 《지능》을 가진다. 즉 주변장치와 모선사이에서 통신기능을 수행 
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하기 위한 론리를 포함한다. 

독자들은 왜 주변장치들을 직접 체계모선에 련결시키지 않는가 하고 이상하게 여 
길수 있다. 그 리유는 다음과 갈다. 

• 여러가지 조작방법을 가진 아주 다양한 주변장치들이 있다. 여러 장치들을 조종하 
기 위 하여 처리장치 내에 필요한 론리적장치를 설치 하는것은 비현실적일것이다. 

• 보통 주변장치들의 자료전송속도는 기억기나 처리장치의 자료전송속도보다 훨씬 
더 느러다. 따라서 고속체계모선을 리용하여 직접 주변장치와 통신하는것은 비현 
실적이다. 

• 주변장치들은 흔히 그것들이 불어 있는 콤퓨터에서 보다 각이한 자료형식들과 단 
어길이들을 리용한다. 

그리하여 I/O 모둘이 요구된다. 이 장치는 두가지 주요기능을 가진다(그림 6-1). 

• 체계모선 또는 중앙스위치를 거처 처리장치나 기억기와 대면한다. 

• 적당한 자료련결에 의하여 하나이상의 주변장치와 대면한다. 

이 장에서는 외부장치들에 대한 간단한 론의로부터 시작하여 I/O 모둘의 구조와 기 
능을 고찰하였다. 그다음 처 리 장치와 기 억 기 가 협동하여 I 八)기 능을 수행할수 있는 여 러 
가지 방법들 즉 내부 I/O 대면부를 고찰한다. 끝으로 I/O 모둘과 외부세계사이의 외부 
1八)대면부를 조사한다. 



1 的 


그림 6-1. I/O 모듈의 일반모형 
















제 1 절. 외부장치 

VO 조작들은 외부환경과 를퓨터사이 에서 자료를 교환하는 수단으로 되는 많은 외부 
장치들을 통하여 실현된다. 외부장치는 I/O 모둘에 련결됨으로써 콤퓨터에 접속된다(그림 
6-1). 련결은 I/O 모둘과 외 부장치 사이 에 서 조종，상태，자료를 교환하는데 리 용된 다. V 0 
모둘에 련결된 외부장치를 흔히 주변장치라고 한다. 

주변장치는 크게 세 가지로 분류할수 있다. 

•사람이 읽 을수 있는 장치 (Human readable ) : 공퓨터 사용자와의 통신에 적 합하다. 

•기계가 읽을수 있는 장치 ( Machinereadable ): 장치와의 통신에 적합하다. 

•통신하는 장치 ( Communication ) : 떨어 져 있는 장치들과의 통신에 적합하다. 

사람이 읽을수 있는 장치의 실례는 현시말단 ( VDT ) 과 인쇄기이다. 기계가 읽을수 
있는 장치 의 실례 는 자기원판과 레 프체 계，로보트공학에 리용되 는 수감부와 전동장치 
등이 다. 이 장에 서 는 I/O 모둘로서의 디 스크와 레 프를 고찰하며 제 5장에 서 는 이 것 들을 

기 억 장치 로서 고찰하였 다. 기 능상 견지 에서 보면 이 장치 들은 기 억기의 한 부분이 며 

그 리용에 대 해서는 이미 제 5 장에서 대체 로 론의되 였다. 구조적견지 에서 보면 이 장 

치 들은 I/O 모둘에 의하여 조종되 
므로 이 장에서 고찰하려고 한다. 

통신장치들은 콤퓨터가 떨어 져 
있는 장치와 자료를 교환할수 있 
게 한다.떨 어 져 있는 장치 로는 
말단과 같은 사람이 읽을수 있는 

장치，기계가 읽을수 있는 장치 또 

는 다른 콤퓨터가 될수 있다. 

아주 일반적으로 표현하면 외부 
장치의 본질은 그림 6-2 에서 보여 
준바와 같다. i/o 모둘과의 대면부 
는 조종신호, 자료 및 상태신호의 
형 식 으로 되 여 있다. 조종신호는 
자료를 장치 에 보내 기 (INPUT 또는 
REAL ) ，자료를 VO 모둘로부터 받기 (OUTPUT 또는 WRITE ) ，상태 보고 또는 장치 에 대 한 
특수한 조종기 능수행 (즉 디 스크자두를 지 적 ) 과 갈은 그 장치 가 수행하게 되 는 기 능을 
결정한다. 자료는 비 트들의 묶음형 태 로 I/O 모둘에 보내 지거 나 I/O 모둘로부터 받는다. 
상태신호는 장치의 상태를 지적한다. 장치가 자료전송준비가 되였는가를 보여 주는 
READ / NOT-READY 가 그 실례 로 된다. 

장치 와 관련 한 조종론리 는 I/O 모둘로부터 의 방향에 따라 장치 동작을 조종한다. 변환 
기는 출력할 때 에는 자료를 전기에네르기로부터 다른 형태의 에네르기 로 변환하며 입 력 
할 때에는 다른 형태의 에네르기를 전기에네르기로 변환시킨다. 일반적으로 완충기는 변 
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그림 6-2. 외부장치 





기는 대체로 8〜 16 bit 이 다. 

> 모둘과 외 부장치사이의 대 면부는 제 7 절 에서 고찰한다. 외 부장치 와 환경 
i 부는 이 책에서 취급하는 내용이 아니지만 여기서는 몇가지 간단한 실례 
든다. 

건반/감시장치 

6-1. ASCII 비 트자리 
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퓨터 와 사용자가 호상작용하는 가장 공통적 인 수단으로는 건반/감시 장치이 디 
입 구는 건반이다. 자료는 이 입 구를 통하여 콤퓨터 에 전송되 며 또한 감시징 
|된 다. 그외 에 감시 장치 는 콤퓨터 가 제 공하는 자료를 표시한다. 

본교환단위는 문자이다. 코드는 문자에 관계되며 대체로 卜 8 bit 의 길이를 거 




는 단일 한 7 bit 2 진부호로 표시 된 다. 따라서 128개 의 각이한 문자들을 표시할수 있 다. 표 
6-1 은 모든 코드값들을 보여 준다. 표에 서 매 문자의 비 트들은 맨 웃자리비 트 ( MSB ) 인 
b 7 로부터 맨 아래 자리 비 트 ( LSB ) 인 바 로 표시 된다. 문자에 는 두가지 형 태 즉 인쇄 가능문 
자와 조종문자가 있다 1 (표 6-2). 인쇄 가능문자는 종이 에 인쇄할수 있거 나 화면에 표시할 
수 있는 자모，수자，특수문자들이 다. 례 를 들어 문자“ K ” 의 비 트표시 는 1001011 이 다. 일 
부 조종문자들은 문자들을 인쇄하거 나 표시하는것 을 조종할수 있 어 야 한다. 례 를 들면 
행 바꾸기 ( CR : CarrigeReturn ) 조종문자이 다. 다른 조종문자들은 통신수속 (communications 
procedure ) 과 관계된다. 

건반입 력인 경우 사용자가 건을 누르면 이것은 건반에 있는 변환기 에 의하여 해석 
되 여 대 응하는 ASCII 코드의 비 트패 턴으로 변환되 는 전기 적신호를 발생한다. 그 다음 이 
비 트패 턴을 콤퓨터 안의 I/O 모둘로 전송한다. 콤퓨터 에서 본문은 갈은 ASCII 코드로 기 억 
될수 있다. 출력 인 경우는 ASCII 문자들이 I/O 모둘로부터 외부장치 에로 전송된다. 외부 
장치에서 변환기는 이 코드를 해석하여 출력장치에 련속적인 문자렬을 표시하거나 필요 
한 조종기능을 수행하도록 전기적신호를 보낸다. 

2. 디스크구동기 

디 스크구동기 에 는 자료，조종，상태신호들을 VO 모둘과 교환하기 위한 전자장치 와 디 
스크 읽기/쓰기기구를 조종하는 전자장치들이 있다. 고정-머리디스크에서 변환기는 움직 
이는 디스크겉면에 대한 자기적패 턴과 그 장치완충기에서 비트들사이를 변환시 킬수 있 
다 (그림 6-2). 이 동-머 리 디 스크는 디 스크팔이 디 스크겉 면에 서 왔다갔다 움직 일수 있게 
되여 있다. 

표 6-2. ASCII 조종문자 


형식조종 


BS (Backspace)： 인쇄기구의 움직임을 표시 하거 
나 현시장치 의 유표를 한자리 뒤 로 이 동시키 
는것 을 가리킨다. 

HT (Horizontal tab): 인쇄기구나 현시장치유표를 
다음 미 리할당 “tab” 혹은 정지위 치쪽으로 이 
동시키 는것 을 가리킨다. 

LF(Line feed): 인쇄기구나 현시장치유표를 다음행 
의 시작위치로 이동시킨다는것을 지적한다. 


VT(Vertical tab) : 인쇄 기 장치 구나 현시 장치 유표를 
머 리 할당된 인쇄행 의 다음계 렬 로 이 동시 킨다는 
것 을 가리킨다. 

FF(Form feed) : 인쇄 기 구나 현시 장치 유표가 다음 
폐지，양식，화면의 첫 위치 에 놓인다는것을 가리 
킨 다. 

CR(Carriage return) : 인쇄 기 구나 현시 장치 유표를 같 
은 행의 시작위치에 놓는다. 


1 출구에서 ASCII 코드문자는 I/O 모듈로부터 외부장치에로 전송된다. 장치에서 변환기는 이 코드 
를 번역하여 요구되는 전기적신호들을 출력장치 로 보내 여 지적된 문자를 표시하거 나 요구되는 조종기 
능을 수행 한다. 
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전송조종 


SOH(Start of heading) : 머 리 부의 시 작을 지 적 하 
는데 리용된다. 머리부는 주소나 경로조종정 
보를 가질수 있다. 

STX (Start of text) : 본문의 시 작을 지 적 하며 머 
리부의 끝을 지적하기도 한다. 

ETX(End of text) : STX 로부터 시 작된 본문을 끝 
내는데 리용된다. 

EOT (End of transmission) : 머 리 부가 있는 하나 
이 상의 “본문”의 전송끝을 지 적한다. 

ENQ(Enquiry) : 원격 국으로부터 의 응답요구. 국 
이 그 자체를 식별하는것은 “당신은 누구인 
가” 라는 요구처럼 리용될수도 있다. 


ACK(Acknowledge) : 송신자에 로의 긍정 응답으로서 
수신장치 가 전송하는 문자. 그것 은 문의통보에 
대 한 답례응답으로서 리 용된 다. 

NAK(Negative acknowledge) : 송신자에 로의 부정 응답 
으로서 수신장치 가 보내 는 문자.그것 은 문의 통보 
에 대한 답례응답으로서 러용된다. 

SYN(Synchronous/idle) : 동기 를 보장하는 동기 전송 
체계에 리용된다. 어떠한 자료도 보내여 지지 않 
을 때 동기 전송체 계 는 SYN 문자를 련속 보낸 다. 

ETB (End of transmission block): 통신목적을 위 하여 
블로크자료의 끝을 지 적한다.블로크구조가 처 러 
형식에 필수적으로 관계되지 않는 블로크자료에 
리용된 다. 


정보분리기 


FS (File separator) 

GS (Group separator) 

RS (Record separator) 

US (United separator) 

기타 


그것 들의 계 층이 FS 〜 US 인것 을 제 외하면 선택방 
법으로 리용되는 정보분리기 


NUL(Null)： 문자가 없다.자료가 없을 때 시 간 
채 우기 나 레 프공간채 우기 에 리 용된다. 

BEL (Bell)： 사람의 주의를 끌 필요가 있을때 
리 용된 다. 자명 종이 나 주의장치 들을 조종할 
수 있다. 

50 (Shift out)： 뒤따로는 코드결합이 SI 문자가 
나타날 때까지 비표준문자묶음의 형래로 해 
석 된 다는것 을 가리킨다. 

51 (Shift in)： 뒤 따로는 코드결합이 표준문자묶 

음의 형래로 해석된다는것을 가리킨다. 
DEL (Delete) : 요구되 지 않는 문자들을 지 우는데 
리용된다. 례를 들어 덧쓰기 
SP(Space) : 단어 들을 분러 하거 나 인쇄 기 구 또는 
현시장치유표를 한 자리 앞으로 이 동시키 는 
데 리용되는 인쇄되지 않는 문자 


DLE (Data link escape)： 하나이상의 련속적인 다음문 
자들의 뜻을 변화시키는 문자. 이 것은 보조적조 
종을 제공하거나 임의의 비트결합을 가지는 자 
료문자들의 송신을 허 락한다. 

DC1, DC2, DC3, DC4 (Device controls) : 보조 장 치 나 
특수한 말단특징 들의 조종을 위한 문자 

CAN (Cancel) : 통보문이나 블로크에서 선행 한 자 
료가 무시 된 다는것 을 지 적한다. 

EM (End of medium) : 레프나 다른 매체의 물리적 끝 
또는 매체의 요구되거 나 리용된 부분을 지적한 
다. 

SUB (Substitute) : 오유 또는 무효로 된 글자를 치 환 
한다. 

ESC (Escape) : 규정된 수의 련속문자렬을 주는 코드 
확장문자 
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제 2 절. I/O 모듈 


1. 모듈함수 

FO 모둘에 대 한 주요기 능 혹은 요구는 다음과 같이 분류한다. 

• 조종과 시 간일 치 (동기 화) 

•처리 장치 통신 

• 장치통신 

• 자료완충 

• 오유검 사 

어 떤 시 간동안에 처 리 장치 는 FO 에 대 한 프로그람들의 요구에 따라 예 언할수 없는 형 식 
으로 하나이상의 외부장치들과 통신할수 있다. 주기 억기와 체계모선과 같은 내부자원들은 
자료 FO 를 포함하여 많은 동작들에 서 공유되 여 야 한다. 그리 하여 I/O 기 능은 조종과 시 간일 
치요구를 포함하여 내부자원들과 외부장치들사이 에서 통신량의 넘침을 조절한다. 례를 들어 
외부장치 로부터 처 러 장치 에 토의 자료전송에 대 한 조종은 다음과 같은 순서 로 진행된다. 

• 처 리 장치 는 I/O 모둘에 접 속된 장치 의 상태 를 검 사할것 을 요구한다. 

• I/O 모둘는 장치상태를 처리장치에 보고한다. 

• 장치가 동작하여 전송준비가 되였다면 처리장치는 I/O 모둘에 하나의 지령을 보내 
여 자료전송을 요구한다. 

• I/O 모둘은 외부장치로부터 한 단위의 자료(즉 8〜 16 bit ) 를 얻는다. 

• 자료는 I/O 모둘로부터 처 리 장치 로 전송된 다. 


이 써 네 트 
J： 형 표시 장치 
고속이써네트 
하드디 스크 
이써네트 
레이자인쇄기 
모뎀 


ᅴ 


뉴스 ^터 

犯 S 

10 1 1 C 


====■ 


10 6 10 , 


106 10 7 10 8 


그림 6-3. 대 표적 I/O 모듈의 자료속도 
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만일 체계가 모선을 리용한다면 모든 처리장치와 I/O 모둘사이 호상작용은 하나이상 
의 모선중재를 동반한다. 

선행한 단순한 조작은 VO 모둘이 처 리소자와 통신해 야 하며 또한 외 부장치 와도 통 
신해야 한다는것을 례증한다. 처리소자통신은 다음과 같은것을 포함한다. 

• 지령해신: I 八)모둘은 처리소자로부터 조종모선에 신호로 보내진 지령들을 접수한 
다. 례를 들어 디스크구동기에 대한 I/O 모둘는 다음과 같은 지령 즉 READ 
SECTOR , WRITE SECTOR , SEEK 트랙 크수， SCAN 레 코드 ID 를 접 수한다. 다 
음의 두 지 령들은 다 자료모선에 보내지는 파라메터를 포함한다. 

• 자료: 자료는 자료모선에 의하여 처 리 소자와 I 八)모둘사이 에 서 교환된 다. 

• 상태보고: 주변장치가 너무 느리기때문에 I/O 모둘의 상태를 아는것이 중요하다. 
례 를 들어 처 리 장치 가 I/O 모둘에 자료를 보내 겠는가고 묻는 경우 I/O 모둘은 여 전 
히 그 전의 I/O 지령을 수행하고 있으므로 준비가 되지 않은 상태에 있다. 이러한 
사실 을 상태 신호로 알릴수 있 다. 공통적 인 상태 신호들은 BUSY 와 READY 이 다. 여 
러가지 오유조건들을 보여 주는 신호들도 있 다. 

• 주소인식: 기억기에 있는 매 단어가 주소를 가지는것처럼 VO 모둘도 주소를 가진 
다. 그리하여 I/O 모둘은 그것 이 조종하는 매 주변장치 에 대 한 유일 한 주소를 인 
식해야 한다. 

다른 한편 I/O 모둘은 장치통신을 수행할수 있어야 한다. 이 통신은 지령，상태정보， 
자료를 포함한다(그림 6-2). 

VO 모둘의 기 본과제 는 자료완충이다. 이 기능의 필요성 은 그림 6-3 에서 명백 히 보 
여 준다. 주기억기나 처 리장치안으로 혹은 주기억기 나 처 리장치밖으로의 전송속도가 아 
주 높지만 그 속도는 대부분의 주변장치들에서 보다 낮으며 넓은 범위 에 놓인다. 주기억 
기 로부터 오는 자료는 매 우 빨리 I/O 모둘로 전송된 다. 자료는 I/O 모둘에 완충되 며 그 다 
음 I/O 모둘의 자료속도로 주변장치 에 전송된다. 자료전송이 반대 방향으로 진행될 때에는 
I/O 모둘의 느린 전송조작으로 기억기가 구속을 받지 않도록 자료를 완충한다. 결국 I/O 
모둘은 두개의 장치 및 두 기 억기속도로 동작할수 있어 야 한다. 

끝으로 I/O 모둘은 보통 오유검사와 처 리 장치 에 대 한 보조적 인 오유통지를 할수 있 
다. 오유종류에는 장치에 의하여 보고되는 기계적 및 전기적고장(즉 종이고장，나른 디스 
크자리길)들이 포함된다. 또한 자료가 장치로부터 I/O 모둘로 전송되는것으로 인한 비트 
패턴에서의 비고의적인 변화들에 의하여 생기는 오유도 있다. 전송오유를 검사하는데는 
흔히 일부 형태의 오유검사부호를 리용한다. 자료의 매 문자에 대하여 기우성비트를 리 
용하는것은 일반적 인것으로 되고 있다. 례를 들어 ASCII 문자코드는 한 바이트중에서 7 
개 의 비 트를 차지한다. 8번째 비 트는 그 바이 트에 서 1의 전체 수가 기 수(기 수기 우성 ) 또 
는 우수(우수기우성)가 되도록 설정된다. VO 모둘은 한 바이트가 수신되면 이 기우성비 
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트를 검사하여 오유가 발생했는가를 결정한다. 

2. I/O 모듈구조 

VO 모둘에는 복잡성 과 조종하는 외부장치의 수에 따라 여 러 가지 가 있다. 여 기서는 
이 에 대 하여 매우 일반적 으로만 서술한다(한가지 특별 한 장치 인 Intel 82 C 55 A 에 대 하여 
서 는 제 4 절에서 고찰한다) . 그림 6-4 는 I/O 모둘의 일 반적 인 구성도를 보여 준다. 장치 
는 조종선묶음(즉 체계모선)을 통하여 콤퓨터의 나머지부분들과 련결된다. 장치에로 그 
리 고 장치로부터 전송되는 자료는 하나이상의 자료등록기들에 완충된다. 또한 현재 상태 
정 보를 제 공하는 하나이상의 상태등록기 들이 있을수 있다. 상태등록기 는 조종등록기 로서 
작용하므로 처 리 장치 로부터 구체 적 인 조종정 보를 받는다. 장치 내 에 서 의 론리 는 조종선묶 
음을 통하여 처 리 장치 와 호상작용한다. 조종선묶음은 처 리 장치 가 I/O 모둘에 지 령 들을 보 
낼 때 리 용된 다. 일부 조종선 즉 중재 와 상태신호선들은 I/O 모둘에 의 하여 리 용될수 있 
다. 장치 는 또한 그것 이 조종하는 장치와 관련한 주소들을 인식 하고 발생 시킬수 있어 야 
한다. 매 I/O 모둘은 유일 한 주소를 가지 며 하나이 상의 외 부장치 를 조종하는 경 우에 는 유 
일 한 주소묶음을 가진 다. 끝으로 I/O 모둘은 그것 이 조종하는 매 장치 와의 대 면부에 대 하 
여 특별한 론리를 가지고 있다. 


체 계 모선 외 부장치 

대면부 대면부 



그림 6-4. I/O 모듈의 구성：:接 


I/O 모둘은 처 리 장치 가 단순한 방법 으로 여 러 가지 장치 들을 관리할수 있는 많은 능 
력들이 제공되 여 있다. VO 모둘은 시 간일치，형식，외부장치의 전기 기 계부분 등의 상세한 
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내용을 은폐시켜 처 리장치 가 간단한 읽기 및 쓰기지 령，가능한 열기 및 닫기파일지 령 에 
대 한 기능을 수행할수 있게 한다. 가장 간단한 형 태 에서는 I/O 모둘이 여 전히 처 리 장치 에 
있는 장치 (례로 레프풀기장치)를 조종하기 위한 많은 작업 량이 남아 있을수 있다. 

처리장치와의 높은준위대면부를 실현하면서 상세 한 처리부담의 대부분을 걸머지는 
I/O 모둘은 보통 I/O 통로 혹은 I/O 처 리 장치 이 다. 아주 원시 적 인 그리 고 세 부적 인 조종을 
요구하는 I/O 모둘에 는 I/O 조종기 나 장치 조종기 가 있 다. I/O 조종기 는 일 반적 으로 극소형 
콤퓨터 에 서 리용되 며 I/O 통로는 대 형 콤퓨터 에 서 리 용된 다. 

이제부터 혼란이 없을 때에는 I/O 모둘이라는 일반용어를 리용하며 필요할 때마다 
보다 명백한 용어를 리용하겠다. 

제 3 절. 프로그람식 I/O 

VO 조작에 는 세 가지 기 술이 있 다. 프로그람 식 I/O 를 리용하여 자료를 처 리 장치 와 
I/O 모둘사이에서 교환할수 있다. 처 리장치는 장치상태를 수감하고 읽기 나 쓰기지 령을 보 
내 며 자료를 전송하는것 을 포함하여 I/O 모둘를 직 접 조종하는 프로그람을 실 행한다. 처 
리장치는 I/O 모둘에 지 령을 보낼 때 I/O 조작이 완성될 때까지 기다려야 한다. 처 리장치 
가 I/O 모둘보다 속도가 더 빠른 경우 이 시 간은 불필요한 처 리 장치시 간이 다. 새 치 기구동 
식!/ O 를 리용하여 처리장치는 I/O 지령을 내보내며 다른 명령들을 계속 집행하며 이 명 
령들이 완료되면 I/O 모둘에 의하여 새 치 기된다. 프로그람식 I/O 와 새 치기구동 I/O 인 경 
우 처리장치는 출력할 때에는 주기억기로부터 자료를 뽑아 내고 입력할 때에는 주기억 
기 에 자료를 기 억하는 역 할을 한다. 다른 한가지 방법은 직접기 억기접근 ( DMA ) 이 다. 이 
방식 에 서 I/O 모둘과 주기억 기 는 처 리 장치 의 참가없 이 직 접 자료를 교환한다. 

표 6-3 은 이 세가지 기술들의 관계를 보여 준다. 이 절에서는 프로그람식 I/O 를 고 
찰한다. 새 치기구동식 ！/ O 와 DMA 는 다음의 두 절에서 각각 고찰한다. 


표 6-3. I/O 기 술 



새치기를 리용하지 않을 때 

새치기를 리용할 때 

처 리 장치 를 통한 I/O 와 기 억 기 
사이의 전송 

프로그람식 I/O 

새 치 기-구동 I/O 

I/O 와 기 억기사이의 직접 전송 


직 접 기 억 기 접 근 ( DMA ) 


1. 개팔 

처 리 장치 가 프로그람을 집행하면서 I/O 에 관계되는 지 령을 만나게 되면 지 령을 적합 
한 VO 모둘에 보내여 명령을 실행한다. 프로그람식 I/O 로 동작할 때 VO 모둘은 필요한 
동작을 수행 한 다음 I / O 상태 등록기 에 적 합한 비 트를 설 정 한다 (그림 6-4). I/O 모둘은 더 는 
처 리 장치 에 의거하지 않는다. 특히 처 리장치를 새 치기하지 않는다. 그리하여 처 리장치는 
동작의 완료를 발견할 때 까지 I/O 모둘의 상태 를 주기 적 으로 검 사해 야 한다. 


164 





프로그람식 I/O 기 술은 우선 처 리 장치 가 I/O 모둘에 보내는 I/O 지 령의 견지 에서 고찰 
하고 그다음 처 리 장치 가 실 행 하는 I/O 명 령 의 견지 에 서 고찰한다. 

2. I/O 지 령 

FO 와 관련한 명령을 실행할 때 처리장치는 특수한 I/O 모둘과 외부장치를 구별하기 위 
하여 주소를 내보내고 I/O 지 령을 내보낸다. I/O 모둘이 처 리장치에 의하여 주소화될 때 받을 
수 있는 I/O 지령에는 다음의 4 가지 형태가 있다. 

• 조종: 주변장치를 동작시키는데 리용하며 해야 할 일을 지시한다. 례를 들어 자기테 
프장치는 레프를 감거나 레코드 앞으로 이동할데 대한 명령을 받을수 있다. 이 명령 
들은 적합한 형태의 주변장치에 맞는다. 

• 검사: ]/ o 모둘과 그 주변장치들과 관련된 각이한 상태의 조건들을 검사하는데 리용한다. 
처리장치는 주목하는 주변장치에 전원이 투입되여 리용중에 있는가를 알아야 한다. 또 
한 가장 최근의 1/0동작이 완료되였는가, 오유가 나타났는가 등도 알아야 한다. 

• 읽기 : I/O 모둘이 주변장치로부터 자료항목을 엄 어 내부완충기 (그림 6-4 에서 자료등록 
기)에 넣도록 한다. 그 다음 처 리 장치는 I/O 모둘이 자료모선에 그 자료항목을 내보내 
도록 함으로써 자료항목을 엄을수 있다. 

• 쓰기: I/O 모둘이 자료모선으로부터 자료항목(바이트나 단어)을 꺼내고 련이어 그 자 
료항목을 주변장치 에로 전송하게 한다. 

그림 6-5 1는 주변장치로부터 기억기에로 한 블로크의 자료(즉 레프에서 한 레코드)를 
읽는데 리용한 프로그람식 I / O 의 실례를 보여 준다. 자료는 한번에 한 단어 (16 bit ) 씩 읽어 



다음명령 
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진다. 처리장치는 읽어 지는 매 단어에 대하여 그 단어가 I/O 모둘의 자료등록기에서 리용될 
수 있다는것을 결정할 때까지 상태-검사주기에 놓여야 한다. 이 흐름도는 이 기술의 주요결 
함을 잘 보여 준다. 처 리 장치 가 불필요한 작업을 하는것은 시 간-탕비과정 이 다. 

3. I/O 명령 

프로그람식 I/O 에 서 처 리 장치 가 기 억 기 로부터 꺼 내 는 I/O 관련명 령 들과 처 리 장치 가 
그 명령들을 실행하기 위하여 I 八)모둘에 내보내는 I 八)지령들사이에는 밀접한 대응관계 
가 있다. 즉 명령들은 쉽게 I 八)지령으로 배치되며 이들사이에는 보통 간단한 1:1관계가 
있다. 명령형태는 외부장치들의 주소화방식에 의존한다. 

일반적으로 많은 " O 모둘들은 체계와 I 八)모둘을 통하여 련결된다. 매 장치에는 유일한 
식별자나 주소가 주어 진다. 처리장치가 내보낸 1/◦지령은 필요한 장치의 주소를 포함한다. 
그리하여 매 I 八)모둘은 그 주소행들을 번역하여 지령이 자기것인가를 결정해야 한다. 

처리장치，주기억기，1/◦가 공통모선을 공유할 때에는 두가지 방식의 주소화 즉 기 
억기배치와 기억기분리가 가능하다. 기억기배치식 I 八)인 경우 기억기위치와 I 八)모둘들 
에는 단일한 주소공간이 있다. 처 리장치는 I/O 모둘의 상태와 자료등록기를 기 억기위치 
로 취급하고 기 억기와 I 八)모둘들을 접근하는데 같은 기계명 령들을 리용한다. 따라서 18 
개의 주소행인 경우 임의의 조합으로 총 2 10 =1024 개의 기억기와 I/O 주소를 얻을수 있 
다. 

기 억기배 치식 I 八)에서 단일한 읽기행과 단일한 쓰기행 이 모선상에서 요구된다. 다른 
말로 모선에는 기억기읽기와 쓰기는 물론 입력과 출력지령행들이 설치될수 있다. 지령행 
은 주소가 기 억기위치 나 I/O 모둘을 가리 키는가를 규정한다. 많은 주소령 역 들은 기 억기 
위치나 I 八) 모둘을 둘다 가리키는데 리용될수 있다. 10 개의 주소행이면 체계는 1024 개 
의 기 억 기위치 들과 1024개의 I 八)주소들을 다 지 원할수 있다. 그것은 I 八)주소공간이 기 
억기의 주소공간과 분리되여 있기때문이 다. 이것을 분리식 I 八) 라고 한다. 

그림 6-6 은 이 두개 의 프로그람식 I 八) 기 술을 대 비 한다. 그림 6-6 1는 건 반과 같은 
단순한 입 력 장치 를 위한 대 면부가 기 억 기 배 치 식 I 八) 를 리 용하는 프로그람작성 자에 게 어 
떻 게 보이는가를 보여 준다. lObit 의 주소공간을 512 bit 의 기 억기 (위 치 0〜 511) 와 그우 
의 512 의 I 八) 주소 (위 치 512〜 1023) 토서 가정 하자. 특정 한 말단으로부터 의 건반입 력은 
두개 의 주소를 리 용한다. 주소 516 은 자료등록기 를 가리 키며 주소 517 은 상태 등록기 를 
가리킨다. 상태 등록기 는 또한 처 리 장치 지 령 들을 수신하기 위한 조종등록기 로서 도 동작한 
다. 프로그람은 건반으로부터 처 리 장치안의 축적 등록기 에 들어 온 lbyte 의 자료를 읽 는 
다. 처 리장치는 자료바이트가 있을 때까지 이 동작을 반복한다. 

분리 식 I 八)(그림 6-6 L ) 에서 1/◦ 포구들은 모선에서 I 八) 지 령행들을 능동으로 만드 
는 특수한 I 八)지 령들에 의 해서 만 접근될수 있다. 

대 다수 형 태의 처 리 장치들에 는 기 억 기를 참조하기 위한 상대 적 으로 많은 각이한 명 
령 모임들이 존재한다. 분리 식 I 八) 를 리 용하면 몇 개의 "◦ 명 령 만이 있게 된다. 결국 기 
억 기 배 치 식 I 八) 의 우점 은 이 큰 명 령 저 장고를 리 용하여 더 효과적 으로 프로그람을 작성 
할수 있 다는것 이 다. 결 함은 값 비싼 기 억 주소공간이 리 용된다는것 이 다. 기 억 기 배 치 식 I/O 
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와 분리식 I 八) 는 둘다 흔히 리용된다. 



그림 6-6. 기 억 배 치 식 I 八)와 분리 식 I/O 
n - 기억배치식 I 八)，분리식 I/O 


제 4 절. 새치기구동 I/O 

프로그람식 I/O 에서의 문제는 처 리 장치 가 자료수신이 나 자료송신준비 에 관계 하는 
L / ◦모둘를 오래동안 기 다려 야 한다는것 이 다. 기 다리는 동안 처 리 장치는 I 八)모둘의 상태 
를 거듭 문의해야 한다. 결과 전체 체계의 성능이 대단히 떨어 진다. 

다른 방법은 처리장치가 장치에 " O 지령을 내보낸 다음 다른 유용한 작업을 계속하는것 
이다. I/O 모둘는 처리장치와 자료를 교환할 준비가 되면 처리장치에 새치기를 보내여 봉사 
를 요구한다. 그러면 처리장치는 자료전송을 실행하고 그 다음 선행한 처리를 계속한다. 

우선 I/O 모둘의 관점 에서 이 동작이 어떻게 진행되는가를 고찰하자. 입력할 때 에 
I 八) 모둘는 처리장치로부터 Read 지령을 받는다. 그 다음 I 八) 모둘는 련관주변장치로부 
터 자료를 읽는다. 일단 자료가 장치의 자료등록기 에 있으면 장치는 한 조종신호선으로 
처리장치에 새치기신호를 보낸다. 그 다음 장치는 처리장치가 자료를 요구할 때까지 기 
다린다. 요구가 접수되면 장치는 자료모선에 자료를 태우고 다른 I 八)동작을 준비한다. 
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장치의 견지에서 보면 입력동작은 다음과 같다. 처 리장치는 E 
다음 처리장치는 다른 작업을 한다(처리장치는 한번에 여러개 
g 할수 있다.). 매 명령주기의 끝에서 처리장치는 새치기를 검ᅳ 
-로부터 새 치기 가 발생하면 처 리 장치는 현재 프로그람의 상태 ( 
등록기)를 기 억시 키 고 그 새 치기 를 처 리한다. 이 경우에 처 리 국 
로를 읽어서 기 억기 에 보관한다. 그 다음 처 리 장치 는 동작중이 
다른 프로그람의 내용을 회복하여 실행을 계속한다. 

6-5 l 은 한 블로크의 자료를 읽 기 위한 새치 기 VO 의 리 용을 
비교해 보자. 새치기 I/O 는 불필요한 대기를 없애 버리므로 프 
억 이 다. 그러 나 새 치기 I/O 는 여전히 처 리 장치시 간을 많이 소비ᄀ 
터 I/O 모둘에 로 또는 I/O 모둘로부터 기 억 기 에 로 가는 모든 자 
야 하기 때 문이 다. 


새치기처리 





리장치하드웨 어와 쏘프트웨어 에서 많은 사건들을 시동시 킨다. 그림 6-7 은 새 치기처 리의 
일반적 인 순서를 보여 준다. I/O 모둘이 I/O 동작을 완료할 때에는 다음과 같은 하드웨어 
사건들이 발생한다. 

① 장치는 처리장치에 새치기신호를 보낸다. 

② 처리장치는 그림 3-9 에서 보여 준바와 같이 새치기에 응답하기전에 현재명령의 
실행을 끝낸다. 

③ 처리장치는 새치기가 있는가를 검사하여 새치기를 내보낸 장치에 응답신호를 
보낸다. 응답을 받은 장치는 새 치기신호를 없앤다. 

④ 처 리 장치 는 그 다음 새 치 기 루린 에 대 한 흐름조종준비 를 요구한다. 처 리 장치 는 
시 작할 때 새 치기시 점 에서 현재 프로그람을 회복시키는데 요구되는 정 보를 보 
관해 야 한다. 요구되는 최소한의 정보는 다음과 같다. 

1. 프로그람상태 단어 (PSW) 라고 하는 등록기 에 보관되 는 처 리 장치 의 상태 
1_. 프로그람계수기에 보관되는 실행할 다음명령의 위치 
이 정보들은 체계조종탄창에 보관될수 있다. 

⑤ 처리장치는 그 다음 이 새치기에 응답하는 새치기조종프로그람의 입구점위치를 
프로그람계수기 에 넣 는다. 콤퓨터 기 본방식 과 조작체 계 설계 에 의 거 하면 모든 형 
태의 새치기 또는 모든 장치와 모든 형태의 새치기에 대하여 단일한 프로그람 
이 있을수 있다. 만일 하나이상의 새치기조종루린이 있다면 처리장치는 어느것 
을 불러 내야 하는가를 결정해야 한다. 이 정보는 초기의 새치기신호에 포함되 
여 있을수 있다. 또한 처리장치는 새치기를 보낸 장치에 필요한 정보를 포함하 
는 응답을 보낼것을 요구할수 있다. 

일 단 프로그람계 수기 에 시 작점 위 치 가 설정 되 면 처 리 소자는 명 령꺼 내 기 로부터 시 작 
되는 다음 명령주기를 수행한다. 명령꺼내기는 프로그람계수기의 내용에 의하여 결정되 
므로 조종권은 새치기조종프로그람에로 넘어 간다. 이 프로그람이 수행되면 다음과 같은 
조작을 일으킨다. 

⑥ 이 시점에서 중단된 프로그람과 관계되는 프로그람계수기와 PSW 는 체계 탄 
창에 보관되 여 있다. 그러 나 집 행중프로그람의 부분적 인 《상태》를 보여 주 
는 다른 정보들도 있다. 특히 처리장치등록기의 내용들이 보관되여야 한다. 
그것은 이 등록기들이 새치기조종프로그람에 의 하여 리용될수 있기때문이다. 
그리하여 이 모든 값들과 그외의 다른 상태정보들도 보관되여 야 한다. 일반 
적 으로 새 치 기 조종프로그람은 탄창에 모든 등록기 의 내 용을 보관하는것 으로 
부터 시작한다. 그림 6-8 1는 이에 대한 간단한 실례를 보여 준다. 이 경우 
에 리용자프로그람은 주소 付에 있는 명령다음에 새치기되는것으로 된다. 모 
든 등록기들과 다음명 령의 주소 ( iV +1) 의 내용은 탄창에 넣 어 진다. 탄창지 
시자는 새로은 탄창끝을 가리키도록 갱신되며 프로그람계수기는 새치기봉사 
루린의 시 작을 가리키 도록 갱 신된 다. 
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이상과 갈은 고찰로부터 후에 재개(회복)를 위하여 중단된 프로그람의 모든 상태정 
보를 보관하는것 이 중요하다는것 을 강조한다. 그것은 새 치기 가 프로그람으로부터 접근된 
루린이 아니기때문이다. 새치기는 리용자프로그람이 실행되는 임의의 시간에 임의의 위 
치에서 발생할수 있다. 그의 발생은 예측할수 없다. 이 내용은 다음장에서 고찰하겠지만 
그것은 두개의 프로그람이 공통적으로 일감을 가질수 없으며 서로 다른 두명의 사용자 
에게 속할수 있기때문이다. 

2. 설계의 문제 

새 치기 FO 를 실현하기 위한 설계 에서는 두가지 문제 가 있을수 있다. 첫째 로는 대체 
로 여러개의 I/O 모둘이 있으므로 처리장치가 새치기를 보낸 장치가 어느 장치인가를 어 
떻게 결정 하는가 하는것 이 다. 둘째 로 여 러개의 새 치기 가 일어 나는 경우에 처 리 장치 가 
어느 새치기를 수행해 야 하는가 하는것 이 다. 

우선 장치를 어떻게 식별하는가를 고찰해 보자. 다음과 같은 네가지 일반적인 기술 
들이 공통적으로 리용된다. 

• 여러개의 새치기신호선 

• 쏘프트웨 어 문의 

• 련쇄 (하드웨 어 문의，벡 토르화된) 

• 모선중재 (백 토르화된) 

가장 간단한 방법은 처리장치와 I/O 모둘사이에 여러개의 새치기신호 선들을 제공하 
는것이다. 그러나 새치기선들에 몇개 이상의 모선들이 나 처리장치단자들을 전용으로 리 
용하는것은 비현실적이다. 뿐만아니라 가령 여러개의 선들이 리용된다고 해도 매 선은 
그에 접속된 여 러개의 I/O 모둘들을 가질것 이다. 결국 매 선들에 이 방법을 제외한 세 가 
지 기술들중 어느 한가지를 리용해 야 한다. 

다른 한가지 방법은 쏘프트웨 어문의 방법이다. 처리장치는 새치기를 검출하면 어느 
장치가 새치기를 일으켰는가를 검출할수 있도록 매 I/O 모둘에 물어 보며 그의 일감은 
새 치기봉사루린에 로 이행한다. 이 문의는 개별적 인 지 령선(례 로서 TESTFO ) 의 형 태로 
될수 있 다. 이 경 우 처 리 장치 는 TEST VO 를 발생 하며 주소선들에 특수한 V 0 모둘의 주 
소를 적재한다. I/O 모둘은 새치기가 설정되면 정확히 응답한다. 즉 모든 I/O 모둘에는 주 
소지 정 을 할수 있는 상태 등록기 가 포함되 여 있 다. 처 리 장치 는 매 I/O 모둘의 이 상태 등록 
기를 읽어서 새 치기장치를 식별한다. 일 단 장치 가 정확히 식별되면 처 리 장치는 그 장치 
에 적 합한 특수한 장치 -봉사루린 에 로 이 행한다. 

쏘프트웨 어 문의방법 의 결 함은 시 간을 소비하는것 이 다. 사실상 보다 효과적 인 기 술은 
하드웨 어 문의 을 제 공하는 련쇄 ( daisy - chain ) 를 리 용하는것 이 다. 그림 3_25 에 련쇄 구조의 
실례를 보여 주었다. 이 방법에서는 새치기에 대하여 모든 I/O 모둘이 공통새치기요구선 
을 공유한다. 새치기응답선은 장치를 통하여 련속적으로 련결되여 있다. 처리장치는 새 
치기를 수감하면 새치기응답을 보낸다. 이 응답신호는 알맞는 장치에 도달할 때까지 I/O 
모둘들을 통과한다. 새치기요구장치는 대체로 자료선들에 한 단어를 태우는것으로 이에 
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응답한다. 이 단어는 벡토르로서 I/O 모둘의 주소이거나 혹은 다른 유일한 식별자일수도 
있다. 이 두 경우에 처 리장치는 백토르를 적절한 장치-봉사루린에로의 지적자로 리용한 
다. 이렇게 하면 일반적인 새치기-봉사루린을 실행하지 않아도 된다. 이 기술을 벡토르 
화된 새치기라고 한다. 

벡 토르새 치 기를 리용하는 또 다른 하나의 기술은 모선중재 이다. 모선중재 에서 I / O 모 
둘는 우선 새 치기요구선에 새 치기요구신호를 태우기전에 모선조종권을 획득해 야 한다. 
결국 한번에 하나의 장치만이 그 선에 새치기요구신호를 태울수 있다. 처리장치가 새치 
기를 검출하면 새치기응답선으로 이에 응답한다. 그 다음 새치기를 요구한 장치는 그의 
벡토르를 자료선에 태운다. 

이상에서 언급한 기술들은 새치기를 요구한 I/O 모둘을 식별하는데 리용한다. 또한 
하나이상의 장치가 새치기봉사를 요구할 때 우선권을 할당하는 방법을 제공한다. 여러개 
의 선인 경우 처리장치는 가장 높은 우선권을 가진 새치기선을 포착한다. 쏘프트웨어문 
의에서는 장치들에 물어 보는 순서에 따라 우선권이 결정된다. 이와 류사하게 련쇄방법 
에서 도 장치 들의 순서 즉 우선권을 결정한다. 끝으로 모선중재는 제 3장 4절에서 론의 한 
바와 같이 우선권방식을 리용할수 있다. 

이제부터 새치기구조에 대한 두가지 실례를 보기로 하자. 

3. Intel 82 C 59 A 새치기조종기 

Intel 80386 은 단일한 새치기요구 ( INTR ) 와 단일한 새치기응답 ( INTA ) 선을 가지고 
있 다. 80386 이 각이한 종류의 장치 들과 우선권구조들을 조종하게 하자면 보통 82 C 59 A 
와 갈은 외부새 치 기중재 기를 리 용해 야 한다. 외부장치 들은 82 C 59 A 에 련결되며 그 다음 
에 이 를 통하여 80386 과 련결된다. 

그림 6-9 는 80386에 여러개의 1/◦모둘를 련결하는 82 C 59 A 의 리용을 보여 준다. 하 
나의 82 C 59 A 는 8개 까지의 장치 를 조종할수 있다. 8개 이상의 장치를 조종하는 경 우에는 
82 C 59 A 새 치 기 조종기 를 종속련결 하여 64 개 까지 의 장치 를 조종할수 있 다. 

82 C 59 A 의 유일한 역 할은 새 치기관리 이다. 82 C 59 A 는 련결된 장치로부터 새 치기요 
구를 접수하여 어 느 새 치기 가 가장 높은 우선권을 가지는가를 결정한 다음 INTR 선을 
통하여 처리장치에 신호한다. 처리장치는 INTA 선을 통하여 응답한다. 이것은 82 C 59 A 
로 하여금 자료모선에 해당한 벡토르정보를 내보낸다. 처리장치는 그 다음 새치기처리를 
진행할수 있으며 자료를 읽 거 나 쓰기 위하여 I 八)모둘과 직 접 통신할수 있 다. 

82 C 59 A 는 프로그람화할수 있다. 80386 은 82 C 59 A 에 조종단어 를 설정 하여 리용되 
는 우선권을 결정한다. 다음과 갈은 새 치기방식들이 있다. 

• 고정순위방식 : 새치기요구들이 0( IR 0) 부터 7( IR 7) 까지의 우선권으로 등급화된다. 

• 회전순위방식: 일부 응용들에서 많은 새치기장치들은 우선권이 갈다. 이 방식에 
서 한 장치는 봉사된후에 그 그룹에서 가장 낮은 우선권을 가진다. 

• 특수한 금지: 이것은 처리장치가 어떤 장치로부터의 새치기를 금지하도록 한다. 


172 



82 C 55 A 의 프로그람가능 주변장치대면부 

I 八)와 새치기-구동 I 八)에서 리용된 I / O 모둘의 실례로서 여기서는 Ii 
L 그람가능 주변장치대 면부를 고찰한다. 82 C 55 A 는 단일 소편 이 며 Ii 
는으로 설계 된 일 반목적 I 八)모듈이다. 그림 6-10 은 일 반적 인 구성 도와 











개의 단자로 된 소자의 다리배 치도를 보여 주었다. 

구성 도에 서 오른쪽은 82C55A 의 외 부대 면부이다. 80386 은 조종등록기 를 리 용하여 
24개 의 I八) 선들을 프로그람화할수 있 다. 80386은 여 러 가지 동작방식 들과 입 출구형태 들 
을 규정 하기 위하여 조종등록기 에 값을 설정한다. 24 개의 선들은 세개의 8bit 그룹 
(A，B，C) 들로 나누어 진다. 매 그룹은 8bit 의 I八)포구로 리용할수 있다. 더우기 그롭 C 
는 A 와 묘의 I八) 포구들과 결합하여 리용할수 있는 4bit 의 그롭들 (C A 와 C B ) 로 나누어 
진다. 24개 의 선들은 이 와 갈은 방법 으로 구성 되 여 조종 및 상태 신호들을 전송한다. 

구성도에서 왼쪽은 80386 모선과의 내부대면부이다. 여 기 에는 I八3 포구와 자료를 주 
고 받으며 조종정 보를 조종등록기 에 로 전송하는데 리용하는 8bit 쌍방향자료모선 
(D0-D7) 이 있다. 두개의 주소선들은 3 개의 I八) 포구와 조종등록기중 어느 하나를 지적 
한다. 전송은 READ 혹은 WRITE 선들과 함께 CHIP SELECT 선이 능동상태로 되 였을 
때 진행된다. RESET 선은 장치를 초기화하는데 리용된다. 


T) 니 

그림 6-10. Intel 82C55A 프로그람 가능한 주변결합소자 
블로크도, L- 단자배치도 

처 리 장치는 동작방식 을 조종하며 신호들을 정의 하기 위하여 조종단어를 임의 로 조종 
등록기 에 넣 는다. 3개 그룹의 8개의 외부선들은 3개의 8bitl 八)포구로 작용한다. 매 포 
구는 입 구 혹은 출구로 지 정될수 있다. 한편 그룹 A 와 B 는 I/O 포구로서 리 용하며 그 
룹 C 의 선들은 그룹 A 와 B 의 조종선들로 리용한다. 조종신호선들은 두가지 기 본목적 
즉 “맞잡이 조종방식’’과 새 치 기 요구에 쓰인다. 맞잡이 조종방식은 단순한 시 간일 치 기 구이 
다. DY 선으로서 송신자에 의하여 리용되며 자료가 I/O 자료선에 있다는것을 지적한다. 
또 다른 선은 ACKNOWLEDGE 선으로서 수신자에 의 하여 리 용되며 자료를 읽 었으므로 
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자료선들에 아무 자료도 없다는것을 지적한다. 또 다른 선본 
선으로서 이 선은 체계모선에 구속련결되여 있다. 

82 C 55 A 는 조종등록기 를 통하여 프로그람화할수 있 으 
장치 들을 조종하는데 리용할수 있다. 그림 6-11 은 건반/ 
위해 리용된 82 C 55 A 를 보여 준다. 건반은 8 bit 입력을 제 
즉 SHIFT 와 CONTROL 은 처 리 장치 에 서 실 행 하고 있는 
별 한 의미를 가진다. 이 설명은 단순히 8 bit 자료를 접수동 
태 우는 82 C 55 A 에서 는 명 백하다. 두개 의 맞잡이조종선들- 
는 선들이다. 






현시장치는 또한 8 bit 자료포구와 련결된다. 이 비트들중 두개의 비트 역시 82 C 55 A 
에서 명백한，특수한 의미를 가진다. 두개의 맞잡이조종선들외에 두개의 선들이 추가적인 
조종기능을 제공한다. 


제 5 절. 직접기억기접근 

1. 프로그람식 I/O 와 새치기구동 I/O 의 결함 

새치기구동 I/O 는 단순한 프로그람식 I/O 보다 더 효과적이지만 여전히 기억기의 
I 八) 모둘사이에서 자료를 전송하자면 처리장치의 능동조정을 요구한다. 또한 자료전송은 
처리장치를 통하여서만 진행되여야 한다. 따라서 이 두 방식은 그 자체의 고유한 다음과 
갈은 두가지 결함을 가지 고 있다. 

1. 1八) 전송속도는 처 리 장치 가 장치를 검사하고 그 장치 에 봉사할수 있는 속도에 의 
하여 제한된다. 

2. 처리장치는 매 I/O 전송에서 많은 지령들이 실행되여야 하므로 I/O 전송관리에 
구속된다(례 그림 6-5). 

이 두가지 결함들사이에는 일련의 용납되지 않는 점들이 있다. 이제 블로크자료 
에 대 한 전송을 고찰해 보자. 단순한 프로그람식 I/O 를 리용하는 경 우 처 리 장치 는 
I/O 과제 만을 수행하므로 그외 의 다른 일을 또 할 때보다 오히 려 높은 속도로 자료 
를 전송할수 있다. 새 치기 I 八) 는 이 "◦ 전송속도에서 처 리장치를 어느 정도 해 방한 
다. 그럼 에도 불구하고 이 두가지 방법블은 모두 처 리장치동작과 I/O 전송속도에 나 
쁜 영향을 준다. 

큰 자료를 전송할 때에는 더 효과적인 기술 즉 직접기억기접근 ( DMA ) 을 리용한다. 

2. DMA 기능 

DMA 는 체 계 모선에 추가적 장치 를 포함시 킬것 을 요구한다. DMA 장치 (그림 6-12) 은 
처리장치로 되려는 능력 즉 처리장치로부터 체계에 대한 조종을 실현할 능력이 있다. 이 
것 은 체 계 모선을 통하여 기 억 기 와 자료를 전송할것 을 요구한다. 이 를 위 하여 DMA 장치 
는 처리장치가 요구하지 않을 때에만 모선을 리용하여야 한다. 또는 처리장치가 일시적 
으로 동작을 지연시키도록 하여 야 한다. 이 기술이 더 일반적으로 리용되며 DMA 장치 
가 효과적 으로 모선주기 를 훔치 므로 주기 훔침 방법 (cycle stealing ) 이 라고 한다. 

처 리 장치 가 한 블로크의 자료를 읽거 나 쓸것을 요구한다면 다음과 같은 정 보를 보 
내 여 DMA 장치 에 지 령을 준다. 

• 처리장치와 DMA 장치사이의 읽기나 쓰기조종선을 리용하여 읽기나 쓰기를 요 
구한다. 

• 자료선들을 리 용하여 전송되 는 I 八)모둘의 주소 
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• 자료선우에 전송되고 DMA 장치 에 의하여 그의 주소등록기 에 기 억되는 읽기 나 쓰 
기를 위한 기 억 기의 시 작주소. 

• 자료선들을 통하여 다시 전송되며 자료계수등록기에 기억되는 읽기나 쓰기를 위 
한 단어수. 


자료모선 


주소모선 


DMA 요구. 
DMA 응답 
새치기 
읽기 
쓰기 



그림 6-12. 일반적 인 DMA 구성도 

처 리 장치는 그 다음 다른 동작을 계속한다. 처 리 장치는 이 I 八)동작을 DMA 장치 
에 넘겨 준다. DMA 장치는 처리장치의 참가 없이 전체 자료블로크를 한번에 한 단 
어씩 기억기로부터 기억기에로 직접 전송한다. 전송이 완료되였을 때 DMA 장치는 
처 리장치 에 새 치기신호를 보낸다. 그리하여 처 리 장치는 전송의 시 작과 끝에서 만 참 
가한다(그림 6-5 n ). 그림 6-13 은 명령주기의 어느 위치에서 처리장치가 중지될수 있 
는가를 보여 준다. 매 경우에 처 리 장치는 모선을 리 용하기 직 전에 중지된다. DMA 장치 
는 그 다음 한 단어를 전송하고 처리장치에 조종권을 넘겨 준다. 이것은 새치기가 아니 
다. 즉 처 리장치는 현상태를 보관하지 않고 다른 일을 한다. 오히 려 처 리장치는 한 모선 
주기동안 일시정지 ( pause ) 한다. 결국 처 리장치 가 더 느리게 동작하게 된다. 그럼 에도 불 
구하고 다중단어 I 八) 전송에서 DMA 는 새 치 기 구동이 나 프로그람식 I 八) 보다 훨씬 더 효 
과적 이 다. 
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DMA 기 구는 여 러 가지 방법 으로 구성할수 있 다. 그 일 부를 그림 6-14 에 보여 준다. 
첫 실례 에서 모든 장치들은 갈은 체계모선을 공유한다. DMA 장치는 대 리처 리장치 로서 
동작하면서 DMA 장치를 통하여 기 억기와 I 八) 모둘사이 에서 자료를 교환하기 위하여 프 
로그탐식 I/O 를 리 용한다. 이 구성 은 원가가 눅지 만 효률이 낮다. 처 리 장치-조종프로그 
탐식 I 八)에 서 한 단어 의 전송은 두개 의 모선주기 를 소비한다. 

시간 



접수점 접수점 

그림 6-13. 명령주기안에서 DMA 와 새치기 접수점 

요구되는 모선주기의 수는 DMA 와 I 八)함수들을 통합함으로써 실질적으로 잘리워 질 
수 있다. 그림 6-14 l 가 보여 주는바와 같이 이것은 DMA 장치와 체계모선을 포함하지 않 
는 하나이상의 I 八)모둘사이 에 통로가 있다는것을 의미 한다. DMA 론리는 실제상 1/◦모둘 
의 부분일수 있다. 또는 하나이상의 I/O 모둘들을 조종하는 분리된 장치 일수 있다. 이 개 
념은 I/O 모선을 리용하여 I/O 모둘을 DMA 장치에 련결시 킴으로써 한 단계 더 높은것으 
로 된다. 이것은 DMA 장치에서 I/O 대면부들의 수를 하나로 줄이며 쉽게 확장할수 있는 
구성 을 제 공한다. 이 모든 경우(그림 6-14 u 와 6-14 비들에서 DMA 장치 가 처 리 장치와 기 
억기와 함께 공유하는 체계모선은 기억기와 자료를 교환할 때에만 DMA 장치에 의하여 리 
용된다. DMA 와 1/◦ 모둘사이 에서의 자료교환은 체계모선에서 발생 한다. 

제 6 절. I/O 틍로와 처리장치 

1. I/O 기능의 진화 

콤퓨터체계가 진화하면서 개별적구성요소들의 복잡성과 성능이 높아 지게 되였다. 
이것은 I/O 기능에서 더 명백히 나타난다. 앞에서 이미 진화과정의 한 부분을 보았다. 
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진화단계는 다음과 같이 요약할수 있다. 

1. CPU 는 주변장치 를 직접 조종한다. 이것은 간단한 극소형 처 리 장치-조종장치 들에 
서 볼수 있다. 

2. 조종기나 1/◦모둘이 추가된다. CPU 는 새치기가 없는 프로그람식 I 八)를 리용한 
다. 이 단계 에 서 CPU 는 구체 적 인 외 부장치 대 면부와 분리 된 다. 

3. 단계 2 에서와 갈은 구성 이 리용되지만 여기서는 새치기가 리용된다. CPU 는 I / O 동 
작수행대기에 시간을 소비하지 않고 효률을 높인다. 

4. I/O 모둘은 DMA 를 통하여 기억기직접접근을 수행한다. 이것은 전송의 시작과 끝 
을 제외하고는 CPU 의 참가없이 자료블로크를 기억기로，기억기에서 이동시킬수 있 
다. 

5. I/O 모둘은 그 자체가 I/O 를 위해 만들어 진 특수한 명령묶음을 가진 처리장치 
의 역할을 하도록 하여 야 한다. CPU 는 기 억 기 에 있는 I 八3프로그람을 수행하도 
록 I/O 처 리 장치 에 지 령한다. 이 것은 CPU 가 I/O 동작의 순서를 규정하게 하며 
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전체 순서가 수행될 때에만 새치기되도록 한다. 

6. I/O 모둘은 그 자체의 국부기억기를 가진다. 사실상 그 자체가 콤퓨터라고 할수 
있 다. 이 구성 방식 에 서 많은 1/◦ 모둘들이 최 소한 CPU 의 참가밑 에 조종될 수 있 
다. 그러한 기본방식에 대한 일반적 리용은 호상작용하는 말단들과의 조종통신이 
다. I/O 처 리 장치 는 말단들을 조종하는데 포함된 많은 파일 들을 관리한다. 

콤퓨터체계가 이 경로를 따라 발전하기때문에 점점 더 많은 I 八3동작들이 CPU 참가 
없 이 수행된다. CPU 는 I/O 와 관련과제 에 서 크게 면제 되 므로 성 능을 개선하고 있 다. 마 
지막단계들 (5 와 6) 에서는 프로그람을 실행하는 능력을 가진 I 八) 모둘에 대한 개념이 도 
입됨으로 하여 주요변화가 일어 났다. 단계 5에서 I 八)모둘은 흔히 I 八)통로로 지적된다. 
단계 6에서 I 八 D 처 리 장치 라는 용어 가 흔히 리 용된다. 그러 나 두가지 용어들은 두가지 상 
황에 다 적 응된것 을 전제 로 한다. 이 제 부터 는 I 八)통로라는 용어 를 리 용한다. 

2. I/O 틍로의 특징 



I / O 통로는 DMA 개념의 확장 
이 다. I/O 통로는 I/O 동작을 완 
전히 조종하는 I/O 명 령들을 실 
행할 능력 이 있 다. 그러한 장치 
들을 가진 콤퓨터체 계 에서 CPU 
는 I/O 명 령 들을 실 행하지 않는 
다. 그러한 명 령 들은 주기억 기 에 
보관되 며 I/O 통로 그 자체 에 있 
는 전문목적처 리 장치 에 의하여 
실행된다. 그리하여 CPU 는 I 八) 
통로에 주기억기에 있는 프로그 
탐을 실행할것을 명령함으로써 
1/◦전송을 보장한다. 프로그람은 
장치나 장치들, 대용량기 억기령 
역，우선권，어떤 오유조건에 해 
당한 작용들을 밝힌것 이다. I/O 
통로는 이 명령들에 의해 자료전 
송을 조종한다. 

그림 6-15 에서 보여 주는 두 
가지 형태의 I/O 통로들이 일반 
적 으로 리 용된 다. 통로선택기 는 
여러가지의 고속장치들을 조종하 
며 한번에 그 장치들중 하나와 
자료전송한다. 그러므로 I 八)통로 
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는 한 장치를 선택하고 자료전송에 영향을 준다. 매 장치，또는 적은 묶음의 장치들은 조 
종기 나 우리 가 론의 한 I 八)모둘과 거 의 같은 I 八)모둘에 의하여 조종된 다. 그러 므로 I/O 
통로는 이 I/O 조종기들을 조종하는 CPU 를 대신하여 리용된다. 다중화통로는 단번에 
여 러개 장치들의 I/O 를 조종할수 있다. 저속장치들에서 한 바이트다중화장치는 가능한 
껏 빨리 문자들을 접수하거나 전송한다. 례를 들어 속도가 각이하며 개별적흐름이 각각 
AXA 2 A 3 A 4-", BiB 2 B 3 B 4 ---, QQQQ …인 세개의 장치 들로부터 오는 결과적 인 문자흐름 
은 •••이 다. 고속장치들에서는 블로크다중화장치가 여 러 장치들로부 

터 오는 자료블로크를 교차읽 기 쓰기한다. 


제 7 절. 외부대면부: SCSI 와 FireWire 


1. 대면부의 형태 

FO 모둘로부터 주변장치에 로의 대 면부는 주변장치 의 특징 과 동작에 맞게 제 작되 여 
야한다. 대면부의 한가지 주요특징은 직렬인가 병렬인가 하는것이다(그림 6-16). 병렬대 
면부에는 I/O 모둘과 주변장치들을 련결하는 여러개의 선들이 있으며 한 단어의 모든 비 
트들이 동시에 전송되는것처럼 자료모선을 통하여 여러개의 비트들이 동시에 전송된다. 
직렬대면부에서는 자료전송에 한개의 선만이 리용되며 한번에 한바이트씩 전송된다. 병 
렬대면부는 일반적으로 레프，디스크와 갈은 고속대면부들에 리용된다. 직렬대면부는 인 


쇄기와 말단에 더 적 합하다. 

이 두 경우에 VO 모둘은 주변장치와 
대 화를 진행해 야 한다. 일 반적 으로 쓰기동 
작의 대화는 다음과 같다. 

• VO 모둘은 자료를 보낼 것 을 요구하는 

조종신호를 보낸다. 

• 주변장치는 그 요구에 응답한다. 

• VO 모둘은 자료를 전송한다(주변장치 

에 따르는 한 단어나 블 로크). 

• 주변장치는 자료의 수신에 응답한다. 

읽기동작도 류사하게 진행된다. 

I/O 모둘의 동작에서 기본역 할을 하는 
것은 주변장치와 체계의 나머지부분들사 
이에서 주고 받는 자료를 기억할수 있는 
내 부완충기 이 다. 이 완충기 는 I/O 모둘가 
체계모선과 외부선들사이에서 속도상 차 
이를 없애 버린다. 



1/0 장 치 

- — I 險 

주벼 장 

1 치 에 로 

■빼 ■— 

체계모선 __ 
에로 _ 

1 1 1 1 1 1 1 1 1 

완충기 


기 


— 

I/O 장 치 

치 에 로 

1 1 1 1 1 1 1 1 1 

에로 _ 

완충기 


그림 6 - 16 . 병렬과 직렬 !/0 
1 -병 렬 I / O , l - 직 렬 ！/0 
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2. 1 대 1 및 1 대 N 구조 


콤퓨터체계에 있는 FO 모둘과 외부장치들사이의 련결은 1대 1 및 1 대 N 일수 있다. 
1 대 1 대면부는 I/O 모둘과 외부장치사이에 있는 선을 리용한다. 소규모체계들(개 인용콤 
퓨터，워크스테이션)에서 대표적인 1 대 1 련결은 건반，인쇄기，외부모뎀들을 포함한다. 
그러한 대 면부의 전형 적 인 실례 는 EIA-232 이 다(이 에 대 해서 는 [STAL97] 을 참고) . 

중요한것은 1 대 N 외부대면부이 며 이것은 외부대 용량기 억장치 (디스크와 테프구동 
기 ) 와 다매 체 장치 들 (CD-ROM, 비 데 오，음성 장치 ) 에 리 용된 다. 이 1 대 N 대 면부들은 효 
과적 인 외 부모선들이다. 또한 제 3장에 서 론의 된 모선들과 같은 형 의 론리 를 가진다. 이 
절에서 는 두가지 주요실례 들인 SCSI 와 FireWire 를 보게 된다. 

3. 소령콤퓨터체계대면부 

SCSI 는 외부주변장치들의 대표적 인 실례 이 다. 이것은 1984 년 마킨토쉬에 처음으로 
도입 되 였 다. SCSI 는 현재 많은 워 크스테 이 션에 서 는 물론 마킨토쉬 와 Windows/Intel 체 계 
들에 서 널 리 리 용되 고 있 다. SCSI 는 CD-ROM 구동기，음성 장치，외 부대 용량기 억 장치 들에 
대 한 표준대 면부이다. SCSI 는 8,16,32개 의 자료선들을 가진 병 렬 대 면부를 리 용한다. 

사실상 장치들이 서로 련속적으로 련결되여 있어도 SCSI 구성은 보통 모선으로서 
지 적 된다. 매 SCSI 장치 에 는 입 구，출구의 두개 의 접 속기 가 있 다. 모든 장치 들은 서 로 사 
슬처럼 련결된다. 사슬의 한 끝은 주콤퓨터에 련결되여 있다. 모든 장치들은 독립적으로 
동작하며 주콤퓨터와는 물론 서로 자료를 교환할수 있다. 례를 들어 하드디스크는 주콤 
퓨터의 참가없이 자체로 레프구동기에 재복사될수 있다. 앞으로 서술되겠지만 자료는 통 
보문파케트로 전송된다. 

SCSI 판본들 

초기의 SCSI 는 SCSI-1 이 라고 하며 1980 년대초에 개 발되 였다. SCSI-r 은 8 개의 자 
료선을 리용하며 5MHz 의 박자속도나 5Mbyte/s 의 자료속도로 동작한다. SCSI-1 은 7 개 
까지의 장치를 종속련결시켜 주체계에 걸어 준다. 

1991 년에 교정 판 SCSI-2 가 소개 되 였 다. 가장 주목할만한 변화는 16 개 나 32 개 까지 
로 자료선들을 선택적으로 확장한것이며 박자속도를 10MHz 까지 증가시킨것이다. 결과 
최 대 자료속도가 20 혹은 40Mbyte/s 로 되 였 다. 현재 SCSI-3 이 개 발중에 있으며 이것은 더 
큰 속도를 보장할것 이 다. 

신 호와 시 간단계 

SCSI 모선에서의 모든 교환은 발신자(발신자)와 수신자 혹은 목적지 (수신자)사이 에 
진행된다. 일반적으로 주체계는 발신자이며 주변조종소자는 수신자이다. 그러나 일부 장 
치들은 둘 중 어느 한가지 역할을 할수 있다. 임의의 경우에 모선우에서의 모든 작용은 
련속적 인 시간단계들에서 일어 난다. 그 시간단계들은 다음과 같다. 

• 모선 비 여있기 :어떤 장치도 모선을 리용하지 않으며 모선이 리용될수 있다는것을 지 
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적 한다. 

• 중재: I 八)처리를 초기화하거나 재개하도록 한 장치가 모선조종권을 획득하도록 
한다. 

• 선택: 발신자가 읽기나 쓰기지령과 같은 기능을 수행하도록 수신자를 선택할수 있 
게 한다. 

• 재선택: 수신자가 발신자에 의하여 이미 시동되였으나 수신자에 의하여 중지된 
조작을 회복하기 위하여 발신자와 다시 련결되게 한다. 

• 지령: 수신자가 발신자로부터 지령정보를 요구하도록 한다. 

• 자료: 수신자가 자료전송을 발신자로부터 수신자에로 즉 자료받기 또는 수신자로 
부터 발신자에 로 즉 자료보내기를 요구하게 한다. 

• 상태: 수신자가 수신자로부터 발신자에로 보낸 상태정보를 요구하게 한다. 

• 통보: 수신자로부터 발신자에게로 또는 발신자로부터 수신자에게로 하나이상의 통 
보문을 보낼것을 수신자가 요구할수 있게 한다. 

그림 6-17 은 SCSI 모선시간단계들이 일어 나는 순서를 보여 준다. 재설정 혹은 전원 
을 넣은 다음 모선은 모선이 비 여 있는 단계 에 들어 간다. 다음 중재단계 가 뒤 따른다. 
보통 이 단계 는 어 떤 장치 에 의하여 조종권을 엄 는다. 중재단계 가 끝나면 모선은 모선범 
단계 에 로 되돌아 간다. 중재 가 성 공하면 모선은 이 교환을 위하여 발신자와 수신자장치 
들을 할당하는 선택 이 나 재 선택단계 에 들어 간다. 두 장치 가 결정된후에 는 이 두 장치 들 
이 동반되는 하나이상의 정보전송단계들(지령，자료，상태,통보)이 있게 된다. 

마지 막정 보전송단계 는 일 반적 으로 통보받기 단계 이 다. 이 단계 에 서 는 차단이 나 지 령 
완료통보가 발신자에 로 전송되며 모선이 비 여 있는 단계 가 뒤따르게 된다. 

전원투입과 재설정조건 



SCSI 의 한가지 중요한 특징은 재선택능력 이 다. 완료에 일정한 시 간이 걸 리는 지 령 
이 출력되면 수신자는 모선을 해방하고 그 다음 발신자와 다시 련결될수 있다. 례를 들 
어 주콤퓨터는 디스크구동기에 디스크를 형식화할데 대한 지령을 줄수 있으며 구동기는 
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리용된다. 발신자는 수신자가 모선조종을 
안에 이 신호를 낼수 있다. 

卞는데 리용된다. 

모선단계들사이의 관계를 보여 준다. 표에국 
|•과 추가적 인 REQ/ACK 선들이 있다. 


모선단계 들과 신 호들을 해 석하는데 리용되 
! 례 는 읽 기 ( Read ) 지 령 이 며 자료를 수신자로 




모든 장치들은 BSY 선과 자료선들중의 하나를 점유한다. 8 개의 장치들(한개의 주계산기 
와 7 개의 다른 장치들)은 0 부터 7 까지의 유일한 ID 를 가진다. 매 장치는 그 자체의 ID 
에 대응하는 자료선들중 하나를 점유한다. ID 에는 7 이 가장 높고 0 이 가장 낮은 우선권 
이 할당된 다. 하나이 상의 장치 가 중재단계 기 간에 그의 ID 를 점 유한다면 가장 높은 우선권 
을 가진 장치가 이기게 된다. 다른 장치들은 자료선들을 관찰하여 이것을 인식하며 중재 
를 허용한다. 

일 단 장치 가 중재 를 이기 면 그것은 곧 발신자로 된다. 그것은 SEL 신호를 내보냄으 
로써 Selection 단계 에 들어 간다. 이 단계 기 간에 그 자체 의 ID 와 수신자 ID 를 모두 두 
개의 대응하는 자료선들에 보낸다. 그것은 지연된후 BSY 신호를 무시한다. 목적하는 수 
신자가 SEL 을 내 보내 며 BSY 와 I 八) 가 무시 된 다는것 을 검 사하고 그의 ID 를 인식하면 
BSY 신호를 보낸 다. 발신자는 BSY 를 검 사하면 자료모선을 해 방하고 SEL 을 무시 한다. 

다른 수신자는 C/D 선을 점 유하여 지 령단계 에 들어 갔다는것 을 지 시 한다. 즉 이 선 
은 이 단계 전 기 간에 유지 되 게 된다. 그다음 REQ 를 내 보내 여 발신자지 령 의 첫 바이 트 
를 요구한다. 발신자는 지 령의 첫 바이트를 자료모선에 놓고 ACK 를 유지한다. 수신자 
는 그 바이 트를 읽 은 다음 REQ 를 무시한다. 그다음 발신자는 ACK 를 무시한다. 지 령 
의 첫 바이 트는 지 령의 몇개의 바이트들이 전송되 는가를 가리키 는 동작코드를 포함 
한다. 이 추가적 인 바이 트들은 매 바이 트가 전송되 기전과 후에 REQ/ACK 맞잡이 동 
작으로 전송된다. 

수신자는 지 령을 받고 해석한후 C/D 선을 무시 함으로써 자료받기단계 기 간에 모선을 
차지하며 (자료모선이 자료를 포함한다는것 을 의 미한다) I/O 선을 점 유한다(전송방향은 
수신자로부터 발신자에 로 라는것 을 의 미한다) . 수신자는 요구되 는 자료의 첫 바이 트를 
자료모선에 놓고 REQ 선을 보낸 다. 발신자는 바이 트를 읽 은 다음 ACK 선을 내 보낸 다. 
추가적 인 자료바이 트는 매 바이 트가 전송되 기 전과 전송된후에 REQ/ACK 맞잡이 동작으 
로 전송된다. 

요구되 는 자료를 모두 전송한후에 수신자는 상태단계 에 서 모선을 차지 하고 상태바 
이 트를 발신자에 게 전송하여 전송을 성 공적 으로 완성 했 다는것 을 지 시한다. 이 경 우에 
C/D 선은 다시 점 유되 며 I 八) 선도 점 유를 유지한다. 발신자와 수신자는 상태 바이 트전송 
과 같이 REQ 八、 CK 맞잡이를 리용한다. 

끝으로 수신자는 MSG 를 내 보내 고 지 령완료통보를 포함하는 통보문바이 트를 보내 
여 통보받기단계 에 모선을 놓는다. 발신자가 이 바이 트를 받으면 수신자는 모든 신호들 
을 해 방하여 모선이 비여 있는 단계에 모선을 놓는다. 

그림 6-18 에는 동기전송업무의 실례를 보여 주었다. 동기전송에서 REQ 八 YCK 맞잡 
이는 전송되는 모든 바이트에 요구된다. SCSI 는 동기전송을 지원하는데 이 동기방식은 
보다 적 은 조종시 간을 요구한다. 동기전송방식 은 자료받기 과 자료보내 기단계 들에서 만 
리 용된다. 그것 은 암시 적 인 전송방식 이 비동기이 므로 동기 방식 은 협 상되 여 야 리용될 수 
있기때문이 다. 수신자는 발신자에게 REQ 와 그에 대응하는 ACK 사이 에서 허용되는 최 
소전송주기와 최대편차를 포함 하는 동기 자료전송요구 (Sychronous Data Transfer 
Request ) 통보를 보낸다. 발신자는 같은 통보문에 응답하여 그 자체의 최소전송주기와 
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최 대 REQ/ACK 편 차를 가리 킨 다 . 

일단 이 교환이 일어 나면 동기전송방식은 더 큰 두가지 최소전송주기와 더 적은 두 
가지 최대 REQ/ACK 편차들로 실현되게 된다. 그 다음 자료전송이 다음과 같이 일어 
난다. 송신측은 적어도 최소전송주기들로 분할된 자료바이트들을 보내여 REQ 신호를 발 
생시켜 매 바이트에 알려 준다. 수신측은 즉시 매 수신된 바이트에 ACK 를 응답할 필요 
는 없으나 편차주기 내 에서 한 바이 트로 응답해 야 한다. 송신측은 편차주기내 에 대응하는 
ACK 들을 받는 한 련속적인 바이트흐름을 보낼수 있다. ACK 가 늦어 지면 송신측은 응 
답을 받기 위하여 일시 정지 되 여 야 한다. 

틍보문 

통보문들은 SCSI 대 면부를 관리할 목적 으로 발신자와 수신자사이 에서 교환된다. 통보 
문에 는 lbyte , 2 byte 그리 고 3 byte 이 상의 길 이 를 가진 확장통보문 등의 세 가지 통보문 
이 있다. 그 실례들은 다음과 갈다. 

• 지령완료 (Command Complete ) : 수신자가 발신자에 보내는 통보문으로서 지령이 

끝나서 유효상태가 발신자에게 주어 졌다는것을 가리킨다. 

• 차단 ( Disconnect ): 수신자로부터 발신자에게 보내진다. 현재 련결이 끊어 지지만 

현재 조작을 완성하기 위 하여 후에 재 련결이 요구될것 이 라는것을 통지 한다. 

• 발신자가 검출한 오유 (Initiator Detected Error ): 발신자가 기우성오유가 발생하였 

다는것을 수신자에게 통지 한다. 수신자는 동작을 재개 할수 없다. 

• 실패 ( Abort ): 발신자가 현재동작을 무시하도록 수신자에게 보낸다. 

•동기 자료전송 (Synchronous Data Transfer ): 발신자와 수신자사이에서 교환되며 동 

기자료전송을 확립한다. 

지령 

SCSI 규약의 심 장부는 지 령 묶음이다. 발신자는 수신자에게 일부 작용이 가해 지도록 
지 령 을 내 보낸다. 지 령 은 수신자로부터 자료를 회 복하기 (읽 기 ) , 수신자에 게 자료를 보내 
기 (쓰기) 또는 특정 한 주변장치 에 리용되는 다른 동작 등을 동반한다. 모든 경우에 지 령 
실행은 다음의 단계들의 일부 또는 모두 포함한다. 

• 수신자는 지 령정보를 접수하고 해 신한다. 

• 자료는 수신자에로 또는 수신자로부터 전송된다. 

• 수신자는 상태정보를 발생시키고 되돌린다. 

지령은 발신자가 준비한 지령서술자블로크 ( CDB ) 에 정의된다. 일단 발신자와 수신 
자사이에 련결 이 이 루어 지 면 발신자는 CDB 를 자료모선을 통하여 수신자에 게 보내 여 
지 령을 실행한다. 

그림 6-19 는 CDB 의 일반적 인 형식을 보여 준다. 이것은 다음과 같은 마당들로 이 
루어 진다. 

• 조작코드: 이 코드는 어 떤 지 령 인가를 규정한다. 또한 조작 코드는 CDB 의 나머 
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지형식을 나타낸다. 


요구되는 
바이트수 


2-4 


• 론리장치번호: 수신자에게 붙 
은 물리적 인 또는 가상적 인 
장치 를 식 별한다. 론리장치번 
호들은 공통조종소자들을 공 
유하는 여 러개의 주변장치# 
이 나 디 스크의 여 러 개 의 론 
리 적 인 체 적 들을 주소화하는 
데 리용될 수 있다. 

• 론리블로크주소: 읽기-쓰기동 
작에서 CDB 는 전송을 위한 
론리 시 작주소를 포함한다. 

• 전송길이: 이 마당은 읽기-쓰 
기동작에서 전송될 자료의 련 
속적인 론리블로크수를 규정 
한다. 

• 파라메 터 목록길 이 : 자료보내 
기단계동안에 보내진 바이트 
수를 규정한다. 이 마당은 일 
반적 으로 수신자에 보내지는 
파라메터 들에 리 용된다.(례 
를 들어 방식，진단 또는 로 
그파라메 터 들) 

• 배 치 길 이 : 발신자가 되 돌린 
자료에 대하여 배 치한 최대 
바이 트수를 규정 한다. 

조종: 이 마당은 련결과 기발비트들을 포함한다. 이 비트들은 련결된 지령기구를 
조종한다. 만일 련결비트가 설정되면 현재 지령은 모선이 비여 있는 단계에서 끝 
나지 않지 만 대 신 지 령 단계 를 시 작하여 다음지 령 과 접 촉한다. 만일 기 발비 트가 설 
정되면 수신자는 지령이 성과적으로 완성되여 CDB 에서와 갈은 기발값을 되돌릴 
때 련결지 령완료통보문을 보낸 다. 일 반적 으로 련결지 령 들사이 에 발신자에 의하여 
새치기가 발생하도록 기발값 1을 리용한다. 


.8 bits. 



조작 코드 

론리 장치 번호 

1 론리블로크주소의 부분혹은 예약 


론리블로크주소의 부분{요구되면》 


전송길이/파라메 터목록길이(요구되면》 
/배치길이(요구되면》 


조 종 


그림 6-19. SCSI 지 령서술자 
블로크형식 


SCSI 는 넓 은 령역의 지 령형 태들을 정의한다. 이 대부분은 특수한 종류의 장치 에 대 
하여 고유하다. SCSI -2 는 다음과 같은 장치형태들에 대한 지령을 포함한다. 
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•직접 접 근장치 
• 련속접근장치 
• 인쇄기 




• 처 리 장치 

• 한번만 쓰기장치 

• CD-ROM 

• 스캐 너 

• 빛기억장치 

• 매 체 변환장치 

• 통신장치 


또한 모든 장치형태들에 리용되는 17 개의 지령묶음이 있다. 물론 다음의 4 개는 모 
든 장치들에서 필수적인것으로서 반드시 실현되여야 한다. 

• 물음 ( Inquiry ): 수신자와 그에 접속된 주변장치들의 파라메터들을 발신자에게 보 
낼것을 요구한다. 

• 수감요구 (Request Sense ): 수신자가 발신자에게 수감자료를 전송할것을 요구한다. 
수값자료에는 오유조건(례 :종이 없음)，위 치정보(례 : 매체끝)，론리상태정보(례 : 현 
재지 령 이 filemark 와 접촉하였다.) 등이 있다. 

• 진단보내 기 (Send Diagnostic ) : 수신자는 그 자체 에 대 하여 접 속된 주변장치 들에 
대 하여 또는 이 둘에 대 하여 진단시 험 을 수행할것 을 요구한다. 

• 시험 장치 준비 (Test unit ready ) : 론리 장치 가 준비 되 였는가를 검 사하는 수단을 준다. 

SCSI 의 지령저장고는 이 규정의 주요우점이다. 그것은 주체계에서의 I 八) 쏘프트웨 

어를 작성하는 과제를 간단화하는 개인용콤퓨터와 워크스테이션에 접속된 가장 공통적 
인 장치들을 취급하는 표준방법을 제공한다. 

4. FireWire 직렬모선 

처리장치의 속도가 100 MHz 에 이르고 대용량기억장치들이 수 Gbit 를 보관할수 있게 
되 면서 개 인용콤퓨터，워 크스테 이 션，봉사기 들에 대 한 I 八)요구조건들도 높아 지 게 되 였 
다. 대형콤퓨터와 초고속콤퓨터체계에서 개발된 높은 속도 I 八)통로기술을 이 작은 체계 
에 리용하기 에 는 아직 값이 너 무 비 싸고 부피 가 크다. 따라서 SCSI 와 다른 작은 체 계 
I 八)대 면부들에 리 용할수 있는 고속대 치방도를 개 발하는데 큰 관심 을 가지 게 되 였 다. 그 
결과 IEEE 표준 1394 가 나오게 되였으며 이것이 바로 일반적으로 FireWire 로 알려 진 
고성 능직 렬 모선 이 다. 

FireWire 는 SCSI 와 다른 I/O 대 면부들보다 많은 우점 을 가진 다. 즉 속도가 매 
우 높고 가격 이 눅으며 그 실현이 쉽 다. 사실상 FireWire 는 콤퓨터체 계 에서뿐아니 라 
수자식카메라， VCR , TV 와 같은 소비자용전자제품들에서도 인기가 있다. 이 제품들에 
서 FireWire 는 수자화된 원천으로부터 점차적으로 오는 비데오화상들을 전달하는데 
리 용된 다. 

FireWire 대면부의 한가지 우점은 그것 이 병렬전송이 아니 라 직렬전송(한번에 한 
비트)을 리용한다는것 이 다. SCSI 와 갈은 병렬대면부들은 심선들이 많을수록 더 굵어지 
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고 더 비싸다. 그리고 케블들이 굵을수록 구부러지거나 꺾이는 부위들이 많아 지며 더 
비싼 접속부들이 요구된다. 더 많은 심선들을 가진 케블은 심선들사이의 전기적간섭을 
막기 위한 차폐를 요구한다. 또한 병렬대면부에서 선들사이의 동기화가 요구되며 케블길 
이가 증가함에 따라 더 나쁜 현상들이 나타난다. 

더우기 콤퓨터는 계산능력과 I/O 요구가 증가하는 반면에 물리적으로는 더 작아 지 
고 있다 .손바닥콤퓨터 와 주머 니 크기를퓨터들은 접속기 들에 대 하여서는 거의 나 공간을 
소비 하지 않지만 화상과 비데오를 조종하는데는 높은 자료속도를 요구한다. 

FireWire 의 목적은 단일포구를 통하여 여러 장치들을 조종할수 있는 간단한 접속 
기 를 가진 단일 한 I 八)대 면부를 제 공하는것 이 다. 그리 하여 마우스, 레이 자인쇄 기， SCSI , 
외부디스크구동기, 스피카，론리령역망접속들이 이 단일접속기로 교체될수 있다. 이 접 
속기 는 Nintendo Gameboy 에 서 리 용된것 에 서 착상되 였 다. 그것 은 아주 편 리 하여 사용 
자가 기계뒤에 가서 보지 않고도 그것을 끼울수 있다. 

5. FireWire 구성 

FireWire 는 63개 까지 의 장치 들을 단일포구에 련결 할수 있는 련쇄 구성 을 리 용한다. 
더우기 1022 까지의 FireWire 모선들이 다리를 리용하여 호상련결될수 있으므로 체계가 
요구하는것만큼의 많은 주변장치들을 지원할수 있게 한다. 

FireWire 는 콤퓨터의 전원을 끄거나 체계를 재구성하지 않고 주변장치들을 련결하 
거 나 차단할수 있게 하는 작업중 접속 (hot plugging ) 이 라고 하는 기능을 제공한다. 또 
한 FireWire 는 자동구성을 제공한다. 즉 장치 ID 설정 이 나 장치들의 상대적위치와 련관 
시 키 는것 을 수동적 으로 하지 않는다. 그림 6-20 은 FireWire 구성 을 SCSI 와 비 교한다. 
SCSI 에서 모선의 두 끝에는 종단기가 있으며 매 장치에는 구성부분으로서 유일주소가 



그림 6-20. SCSI 와 고속직 렬 포구의 비 교 
1 -SCSI 구성 실례, l - 고속직 렬포구구성 실례 
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할당된다. 

FireWire 에는 종단이 없으며 체계는 자동적으로 주소를 할당하기 위한 구성기능을 
수행한다. 또한 FireWire 모선은 엄밀한 련쇄가 아니여도 된다. 오히려 나무구조구성이 
가능하다. 

FireWire 규격의 주요특징은 주체계가 직렬모선을 통하여 주변장치들과 호상작용하 
는 방법들을 표준화하는 세 층으로 된 규약묶음을 규정한것 이 다. 그림 6-21 은 이 탄창 
을 보여 준다. 탄창의 세 층은 다음과 갈다. 

• 물리층: FireWire 에 서 허 용되 는 전송매 체 와 전기 적 및 신호적특징 들을 각각 
정 의 한다. 

• 련결층: 자료전송을 파케트로 묘사한다. 

• 업무층: 응용으로부터 FireWire 의 보다 낮은 층세부를 은폐 시 키는 요구-응답 
규약을 정 의한다. 

물리층 

FireWire 의 물리 층은 각이 한 물리적 속성들과 자료전송속성들과 함께 여 러가지 다 
른 전송매체 와 그 접속기들을 규정 한다. 자료속도는 25~400 Mbps 로 정의된다. 물리층은 
2 진자료를 여러가지 물리적매체에 알맞는 전기신호로 변환한다. 이 층은 한번에 단 하 
나의 장치만이 자료를 전송할것을 담보하는 중재봉사를 제공한다. 

FireWire 는 두가지 형태의 중재를 제공한다. 가장 단순한 형태는 초기에 언급된바 
와 같이 FireWire 모선우에서 마디들의 나무-구조할당에 기초한다. 이 구조의 특수경우 
는 선형 련쇄 이 다. 물리 층은 한 마디는 나무의 뿌리 로서 설계 되 고 다른 마디들은 부모/자 



그림 6-21. 고속직 렬 포구규약블로크도 
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식관계로 조직화되여 나무배 치를 이루도록 자체로 모든 접속된 장치들을 구성하는 론리 
를 포함한다. 일단 이 구성 이 이루어 지면 뿌리마디는 중심중재기로서 작용하여 처음에 
온것 이 처음에 봉사되는 방식 으로 모선접근에 대 한 요구를 처 리한다. 동시 에 일어 나는 
요구에 대하여 가장 높은 자연우선권을 가진 마디가 접근된다. 자연우선권은 어느 경쟁 
마디가 뿌리에 제일 가까운가，뿌리로부터 갈은 거리에 있는가에 의하여 결정되며 더 낮 
은 ID 번 호를 가진 다. 

앞에서 언급된 중재방법 은 두개 의 추가적 인 기 능들 즉 공평 중재 와 긴급중재 에 의하 
여 실현된다. 공평중재에서 모선우에서의 시간은 공평성간격으로 조직된다. 간격의 초기 
에 매 마디 는 중재，허 가기 발을 설정한다. 그 시 간간격 동안 매 마디 는 모선접 근을 얻 기 
위해 경 쟁한다. 일 단 마디 가 모선접 근을 엄 으면 중재 -허 가기 발을 재 설정 하고 이 시 간간 
격동안에 공평접근에 대해서는 다시 경쟁을 하지 않는다. 이 구성은 중재를 보다 쉽게 
하며 하나이 상의 높은 우선도를 가진 장치 들이 모선을 독점하는것 을 막는다. 

공평성구성외 에도 일부 장치 들은 긴급 우선도를 가지 도록 구성할수 있다. 그러 나 마 
디들은 공평성간격동안에 모선을 여러번 조종할수 있는 기회를 얻을수 있다. 본질상 계 
수기 는 우선도가 높은 마디 들이 리용되 는 모선시 간의 75%를 조종하도록 모든 우선도가 
높은 마디에서 리용된다. 긴급하지 않게 전송되는 매 파케트에서 세개의 파케트들은 긴 
급하게 전송될수 있다. 

련결층 

련결층은 자료전송을 파케트의 형태로 진행한다. 두가지 형태의 전송을 지원한다. 

• 비동기 : 각이한 크기의 자료와 여 러 바이트의 업무층정 보가 명시적 인 주소에 파케 
트로서 전송되며 응답이 되돌려 진다. 

• 동기 : 각이한 크기의 자료는 고정 길 이파케 트렬로 변환되 여 일정한 간격 으로 전송 
된다. 이 전송형태의 주소는 간단화된 주소를 리용하며 아무 응답도 없다. 

고정된 자료속도를 요구하지 않는 자료는 비동기적으로 전송된다. 공평중재와 긴급 
중재방식 들은 다 비 동기 전송에 리 용할수 있 다. 암시 적방법 은 공평 중재 이다. 본질 적 으로 
모선능력 을 요구하지 만 심 한 지 연을 요구하는 장치 들은 긴급중재방법 을 리 용한다. 례 를 
들어 고속실 시 간자료수집마디 는 자료완충기 가 절 반이 상 찼을 때 긴급중재 를 리용할수 
있 다. 

그림 6-22 가 는 대 표적 인 비 동기업 무를 보여 준다. 단일 한 파케 트를 전달하는 처 리 
를 보조작용이 라고 한다. 보조작용은 5개의 시간주기로 이루어 진다. 

• 중재순서 : 이것은 어떤 장치 에 모선조종을 주도록 요구한 신호들의 교환이 다. 

• 파케 트전송: 모든 파케 트는 원천 ID 와 목적 ID 를 포함하는 머 리 부를 가지 고 있다. 
머 리 부에 는 또한 파케 트형 태 정 보,순환여유검 사 ( CR 必,특수 파케 트형 태 에 대 한 
파라메터 정 보가 있 다. 파케 트는 또한 사용자자료와 또 다른 CRC 로 이 루어 진 자 
료블로크를 포함한다. 

• 응답간격: 이것은 목적지가 파케트를 수신하고 해신하여 응답을 발생시키는데 필 
요한 시간이 다. 
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• 응답: 파케 트의 수신자는 수신자가 취 한 작용을 가리 키는 코드를 가지는 응답파케 
트를 되돌린다. 

• 보조작용간격: 이것은 모선상의 다른 마디들이 응답파케트들이 전송되기전에 중재 
를 시 작하지 않는다는것을 담보하는 강제적 인 빈 주기 이 다. 

부분동작 1:요구 부분동작 2:응답 

부 ft 작^^ 파 케 드 | fii 응답 |부 tt 작!^^ ~~ 파케트 isii 응답 |부 sf 작 

부분동작 1:요구 " 1> 부분동작 2:응답 

， 작 ■ 파케트 mu 네 부 a 작 

1 통로 2 통 1 3 통로 

a 길 _ 과케 


그림 6-22. 고속직 렬 포구부분동작 

기-비동기부분동작실례 , 련결된 비동기 부분동작, 도-동기 부분동작실례 

응답이 전송될 때에는 응답마디가 모선의 조종하에 있게 된다. 그러므로 교환이 두 
마디사이 요구/응답호상작용이라면 응답마디는 직접적으로 중재공정을 거치지 않고 응 
답파케트를 전송할수 있다(그림 6-22 u ). 

수자음성 이 나 비 데오와 같이 자료를 규칙 적 으로 발생하거 나 소비하는 장치 에서 는 
동기접근이 보장된다. 이 방법은 자료가 담보된 자료속도로 규정된 대기시간내에 전달될 
수 있다는것을 담보한다. 

동기 및 비 동기자료원천의 혼합통신량부하를 모두 처 리 하기 위하여 하나의 마디 가 
기 본순환주기시 동자로 지 적 된다. 이 기 본순환주기시동자는 주기 적 으로 순환시 작파케 트를 
보낸다. 이것은 다른 모든 마디들에 동기 주기 가 시 작되 였 다는것 을 통지한다. 이 순환주 
기기간에는 오직 동기파케트만이 보내 질수 있다(그림 6-22 n ). 매 동기자료원천은 직 
접 적 으로 모선접 근을 진행한다. 이 긴 마디 는 즉시 파케 트를 전송한다. 이 파케 트는 응답 
이 없으며 따라서 다른 동기자료원천은 앞의 동기파케트가 전송된 후에 모선에 대한 직 
접 중재 를 진행한다. 그 결과 하나의 파케 트전송과 다음 파케 트중재 주기 까지 의 사이 에 작 
은 간격이 생기며 이것은 모선우에서의 지연으로 결정된다. 이 지연을 동기간격이라고 
하며 이것은 보조작용간격보다 작다. 

모든 동기 원천 이 전송된 후에 모선은 보조작용간격 이 나타나기에 는 충분한 긴 간격 
을 남긴다. 이것은 모선접근을 완성하기 위한 비동기원천의 신호로 된다. 이 동기원천은 
다음주기가 올 때까지 모선을 리용할수 있다. 
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동기파케트들은 동기자료를 교환하려는 두 마디사이 회화에 의하여 이전에 할당된 
8 bit 통로번호로 표식 이 붙게 된다. 머 리부는 비동기 파케트의 머 리부보다 더 짧으면서도 
자료길 이 마당과 머 리 부 CRC 를 포함한다. 

참고문헌과 Web 싸이트 

8255 A 와 82 C 55 A 를 비롯한 Intel 계 렬 I/O 모듈과 기본구성 에 대 하여서는 
[ BRAY 9 기에서 잘 고찰하고 있다. 

SCSI 에 대한 좋은 개론을 주는 책은 [ SCHM 9 기와 [ NCR 9 이의 두 책이며 
[ ANDE 98] 에서는 FireWire 에 대 하여 구체적으로 고찰하고 있다. 

ANDE98 AnDerson, D. FireWire System Architecture. Reading, MA: Addison-Wesley, 1998 
BREY97 Brey, B. The Intel Microprocessors:8086/8066, 80186.80188, 80286, 80386, 80486, 
Pentium, and Pentium Processor. Upper Saddle River, NJ: Prentice Hall, 1997. 

NCR90 NCR Corp. SCSI: Understanding the Small Computer System Interface. Englewood 
Cliffs, NJ: Prentice Hall, 1990. 

SCHM97 Schmidt, F. The SCSI Bus and IDE Interface. Reading, MA: Addison-Wesley, 1997. 



Web 싸이트: 

• T 10 Home Page ： T 10 은 정보기술표준국가위원회의 기술위원회 
(Technical Committee of the National Committee on 
Information Technology Standards ) 이 며 보다 낮은 준위 대 면 
부에 대응한다. 이 위원회의 기본작업은 작은 콤퓨터체계대면부 
( SCSI ) 이다. 

• SCSI Trade Association ： 기술정보와 통신회선제공회 사 간판 
(Vendor Pointer ) 을 포함한다. 

• B 94 Trade Association ： 기술정보와 FireWire 에 대한 통신회선 
제공회사 간판을 포함한다. 


련습문제 

1. 제 6 장 제 3 절에서는 분리된 I 八) 와 비교하여 기 억기배 치식 I 八) 의 한가지 우점과 
결함을 서술하였다. 우점과 결함을 두가지 이상 말해 보시오. 

2. DMA 장치 를 포함한 모든 가상체 계 에서 주기 억기 에 대 한 DMA 접근은 주기억기 에 
대 한 CPU 접 근보다 더 높은 우선권을 가진 다. 왜 그런 가? 






3. 문제 5,6 에 서술된 디스크체계를 보자. 여기서 디스크회전속도가 360r/min 이 라고 
하자. 처 리 장치 가 바이 트당 하나의 새 치 기 를 가지 는 새 치 기 구동 I/O 를 써 서 디 스 
크로부터 한개 분구를 읽 는다. 매 새 치 기 를 처 리 하는데 2. 5 m s 가 걸 린 다면 처 리 장 
치 가 I/O 를 구동하는데 몇 %의 시 간이 들겠는가? 

4. DMA 를 써서 문제 3 을 다시 해 보시 오. 분구당 한개 새 치 기를 가정 하시 오. 

5. DMA 장치 는 9600bps 로 자료를 전송하는 장치 로부터 순환주기훔침 을 리용하여 
기 억 기 로 문자를 전송하고 있 다. 처 리 장치 는 초당 100 만개 지 령 의 속도 (1MIPS) 로 
지 령을 꺼 낸다. DMA 의 작용으로 처 리장치는 얼마나 떠지는가? 

6. 32bit 콤퓨터에는 두개의 선택기통로와 다중화장치통로가 있다. 매 선택기통로는 두 
개 의 자기디 스크와 자기레 프장치 를 지 원한다. 다중화장치통로는 두개 의 행인쇄 기， 
두개의 카드읽기장치，그에 련결된 10 개의 VDT 말단을 가진다. 이제 전송속도가 
다음과 같다고 가정 하자. 

디 스크구동기 : 800kbyte/s 

자기 테 프구 동기 : 200kbyte/s 

행 인쇄 기 : 6.6kbyte/s 

카드읽 기 장치 : 1.2kbyte/s 

VDT ： lkbyte/s 

이 체계에서 최대 총 I 八)전송속도를 평가하시오. 

7. 콤퓨터가 하나의 처 리장치와 한개 단어의 너비로 모선을 공유하여 주기억기 M 에 
련결된 I 八)모둘 D 로 이 루어 져 있다고 하자. 처 리 장치 는 최 대 초당 10 6 개 의 지 령 
을 실행할수 있다. 평균 한개 지 령은 5 개의 기계주기를 차지하는데 그중 세개는 
기억기모선을 리용한다. 기억기의 읽기쓰기조작은 한개 기계주기를 사용한다. 처리장 
치는 련속적으로《배경》프로그람을 집행하는데 이 프로그람은 95% 가 지령실행 이고 
나머지가 I 八)지령이라고 하자. 하나의 처리장치주기는 하나의 모선주기를 요구한다 
고 가정 하자. 이제 I/O 모둘이 아주 큰 자료블로크를 M 과 D 사이 에 전송한다고 하 
자. 

-T. 만일 프로그람식 I/O 가 리용되고 매개 한개 단어 I/O 전송이 두개 지령을 
실 행할것 을 처 리 장치 에 요구한다면 D 를 통하여 가능한 I/O 자료전송속도 
(초당 단어)의 최대값을 평 가해 보시오. 

L. DMA 가 리 용된 다면 이 와 같은 속도를 평 가해 보시 오. 

8. 자료원천은 7bit ASCII 문자이고 여기에 기우성비트를 첨가하자. 다음의 경우에 
R-bps 행 이상의 최대유효자료속도에 대한 식을 유도하시오. 

1. 1.5 단위정지비 트를 가진 비동기 전송 

L. 48 개의 조종비트와 128 개의 정보비트로 구성된 틀을 가진 비트동기전송 
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n . l 와 같은데 1024 bit 의 정보마당이 있다. 

H . 틀당 9개의 조종문자를 가지고 있고 16개의 정보문자가 있는 문자동기 
n . 근 와 갈은데 128개 의 정 보문자를 가지 고 있 다. 

9. 다음문제는 [ ECKE 9()] 에서 제안된 I 八)원리에 기초한다(그림 6-23). 두 소년들이 높 
은 울타리의 서로 다른 쪽에서 놀고 있다. 그중 한 소년의 이름은 사과공급자로서 
그는 먹 음직한 사과가 주렁 주렁 달린 아름다운 사과나무를 가지 고 있는데 다른쪽 
소년이 요구할 때 마다 사과를 준다. 다른 소년은 사과먹새기 라고 하는데 사과를 
먹기만 하고 아무것도 하지 않는다. 그러나 그는 사과를 고정된 속도로 먹어야 한 
다. 정해 진 속도보다 빨리 먹으면 그는 앓게 된다. 천천히 먹으면 배고파 한다. 
소년은 말할수도 없으며 따라서 문제 는 사과공급자로부터 사과먹새기 로 정 해 진 
속도로 사과를 보내 주는것 이 다. 



그림 6-23. 사과문제 


1. 울타리꼭대기에 경보시계가 있으며 그 경보시계가 여 러가지 경보를 낼수 있다고 
하자. 경 보시계 를 리용하여 이 문제를 어 떻게 풀수 있는가? 풀이를 위한 시 간선 
도를 그려 보시오. 

경보시계가 없다고 하자. 대신 사과먹새기가 사과를 요구할 때마다 흔들수 있는 
기발을 가지고 있다고 하자. 새로운 풀이를 구하시오. 사과공급자도 기발을 가 
지면 좋겠는가? 만일 그렇 다면 이것은 부정학한 풀이 로 된다. 이 방법의 결함을 
론의해 보시오. 

n . 이제 기발대신 문자렬의 긴 조각을 생각하자. 문자렬을 써서 1•에서 보다 좋은 
풀이를 찾으시오. 

10. 16 bit 와 8 bit 극소형 처 리장치가 체계모선과 결합되여 있다고 하자. 다음과 같은것를 
이 상세히 주어져 있다고 하자. 

① 모든 극소형처리장치는 임의의 형태의 자료전송에 필요한 장치적특징을 가지고 
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있 다. 

② 모든 처 리 장치 는 16 bit 주소모선을 가진다. 

③ 매 용량이 64 KB 은 두개의 기억기기판이 모선과 결합되여 있다. 설계가는 될수 
록 큰 공유기억 기를 리 용하려 고 한다. 

④ 체 계 모선은 최 대 로 4 개 의 새 치 기 선과 DMA 선을 가진다. 

필요한 임의의 다른 가정을 할수도 있다. 

1 . 선의 종류와 번호에 의 해 서 체 계 모선을 지 정 하시 오. 

앞에서 서술한 장치가 어떻게 체계모선에 결합되는가를 설명하시오. 

참고: [ ALEX 93] 

11. SCSI 모선우에서 매 I/O 모둘는 가장 빠른 속도인 돌발전송속도를 결정하기 위해 
주콤퓨터와 협상한다. 최대돌발전송속도가 주콤퓨터 에서 20 MB/S 라고 하자. 모든 
장치가 적당한 완충기를 가지면 모선시간내의 경쟁에서도 전송을 계속 유지한다고 
하자. 

- T . 500 Kbyte/s 의 전송속도와 4 Mbyte/s 의 전송속도로 레 프구동기 가 SCSI 
에 결 합되 여 있 다고 하자. 같은 모선에 디 스크구동기 를 각각 6 Mbyte/s 의 
전송속도와 20 Mbyte/s 의 돌발속도로 접속할것을 원한다고 하자. 모든 
장치 를 최 대 속도로 동시 에 기 동시 키 자면 모선 에 최 대 몇대 까지 접 속시 킬 
수 있는가? 

풀이방향: 모든 자료를 전송하는데 필 요한 매 장치 의 시 간비률을 결 정 
하시오(주의: 1 K 를 1024가 아니라 1000으로， 1 M 를 1,048,576이 아 
니 라 1,000,000 으로 하시오. 이 근사는 이 문제의 목적과 아주 가 
깝다. 전송속도는 보통 10 진수에 기 초한 수를 리 용하여 표시 되지 만 
완충기크기 와 전송크기와 갈은 수들은 보통 2 진수에 기초한 수들을 
리용하여 표시 된 다. ) . 

u . 이 제 이 모형 을 좀 더 고찰해 보자. 레 프구동기 가 4 ms 의 모선간접 소비 시 
간을 요구하며 최 대 전송크기 가 64 Kbyte 라고 하자. 디 스크구동기 역 시 
전송할 때마다 4 ms 의 모선간접소비시 간이 들며 그때 전송마다 256 Kbyte 
의 량을 전송한다. 매 장치당 모선의 점유률과 총체적 인 점 유률을 재평 가 
하시 오. 모선이 1에서 의 당신의 대 답에서 규정 된 장치수에 알맞는다고 
생 각하는가? 


197 



짧은시간 
일 정 작성 


프로쎄 스로부터 
봉사접근 


프로쎄 스로부터 
새치기 


프로쎄 스에 로 
조종보내기 


♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦ 

♦ 조작체계는 처리장치에서 프로 그람들의 집행을 조종하고 처리장치자원들을 관리 
하는 쏘 프트웨 어 이 다. 프로 쎄 스일정 작성 과 기 억 기 관리 를 포함하는 조작체 계 의 여 
러 가지 기능들은 처 리장치하드웨 어 가 조작체계를 지 원하기 위한 능력들을 가진다 
면 더 능률적으로 빨리 수행될수 있다. 실제적으로 모든 처리장치들은 가상기억 
관리하드웨어와 프로 쎄스관리하드웨어를 포함하여 크고 작은 범위에서 이와 같은 
능력 을 가진다. 하드웨 어 는 기 본자원관리 과제 들을 수행 하기 위 한 구성 요소들과 
같은 특수등록기들과 완충기들을 자진다. 

♦ 조작체계의 가장 중요한 기능의 하나는 프로쎄스들 혹은 과제들에 대한 일정 작성 
이 다. 조작체계는 프로쎄스가 어떤 주어 진 시간에 집 행되여 야 한다는것을 결정 
한다. 일반적으로 하드웨어는 때때로 조작체계가 여러 프로쎄스들사이에 공정하 
게 처리시간을 분할하도록 새로운 일정작성을 진행할수 있도록 프로쎄스집행을 
중단할수 있다. 

♦ 조작체계의 다른 중요한 기능은 기억기관리이다. 최근의 조작체계들은 가상기억 
기기능을 가지고 있는데 두가지 우점이 있다. 첫째로, 프로쎄스는 프로그람의 명 
령과 자료가 동시 에 주기 억기 에 상주하고 있지 않아도 주기 억기상에서 집 행 할수 
있다는것이다. 둘째로, 프로그람집행에 필요한 기억공간은 체계에 따르는 실제의 
기억공간보다 훨씬 더 크다. 비록 기억기관리가 쏘프트웨어에 의하여 수행된다 
할지라도 조작체계는 장치적으로 페지화와 토막화를 수행하는것을 비롯한 처리장 
치안에서의 하드웨어적인 지원에 의거한다. 


제 7장. 조작체계의 지원 


새치기 

조종기 


□ □□□ 1/01 



♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦ 
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이 책에서는 를퓨터하드웨어에 대하여 주로 고찰하고 있지만 쏘프트웨어의 한 부분 
인 조작체계에 대해서도 필요한 만큼 서술하고 있다. 조작체계는 콤퓨터자원을 관리하 
여 프로그람작성 자에게 봉사를 제공하며 다른 프로그람의 집행순서를 작성해 주는 프 
로그람이다. 조작체계를 리해 함에 있어서 기본은 CPU 가 콤퓨터체계를 조종하는 기구 
라는것 을 인식 하는것 이 다 . 이 책 에 서 는 특히 새 치 기 효과와 기 억 기의 계 층관리 에 대 해 
서 구체적으로 설명하였다. 

이 장에서는 를퓨터조직과 구성 방식의 연구에서 제 일 중요한 조작체계의 두가지 기 
능인 일정작성과 기 억관리를 주로 취급하였다. 

제 1 절. 일반개념 

1. 조작체계목적과 기능 

조작체 계는 응용프로그람의 집 행을 조종하고 콤퓨터 사용자와 를퓨터 하드웨 어사이 
의 대면부로서의 기능을 수행하는 프로그람이 다. 그 필요성은 두가지로 볼수 있다. 

• 편리성 : 조작체계는 콤퓨터를 더 편리하게 사용하게 한다. 

• 효과성 : 조작체 계는 콤퓨터체계자원들을 더 효과적 인 방법으로 리용하게 한다. 

조작체계의 이 두가지 측면을 차례로 설명하기로 하자. 

사용자/콤퓨터 대 면부로서의 조작체계 

그림 7-1 에서 보여 준것처 럼 응용프로그람을 사용자에게 제공하는데 리용되는 하 
드웨어와 쏘프트웨어는 계층형식으로 고찰할수 있다. 이러한 응용프로그람들의 사용자 
는 일 반적 으로 콤퓨터기 본방식과는 무관계하다. 따라서 사용자는 응용프로그람의 견지 
에서 콤퓨터체 계를 고찰한다. 그 응용프로그람은 프로그람작성언어 로 표현되 고 응용프 
로그람작성 자에 의하여 개 발된다. 만일 콤퓨터하드웨 어를 직접적 으로 조종하는 기능을 



그림 7-1. 를퓨터체계의 계층과 고찰 
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가진 처 리장치명 령들의 묶음으로서 응용프로그람을 개 발한다고 하면 아주 복잡한 과 
제에 부닥치게 될것 이 다. 이 과제를 쉽게 하기 위하여 체계프로그람묶음이 제공된다. 
이 프로그람들의 일부를 편의프로그람이라고 한다. 이 도구들은 프로그람개발과 파일 
관리， I/O 장치 조종을 돕는 기능들을 가진다. 프로그람작성 자는 이 기 능을 응용프로그람 
개발에 리용하며 한편 응용프로그람이 집행되는 동안에는 일정한 기능을 수행하기 위 
하여 편의프로그람들을 요구한다. 가장 중요한 체계프로그람은 조작체계 이다. 조작체 
계 는 프로그람작성 자를 대 신하여 하드웨 어 의 구체 적 인 서 술을 담당하며 프로그람작성 
자에게 체계를 리용하는데 도움을 주는 대면부를 제공한다. 이것은 프로그람작성자와 
응용프로그람이 이 기능의 봉사를 접근하고 리용하는데서 중매적 인 기능을 수행한다. 
조작체계가 제공하는 봉사는 대표적으로 다음과 같이 나누어 볼수 있다. 

• 프로그람작성 : 조작체계는 프로그람작성자의 프로그람개발을 돕기 위 한 편집 프 
로그람，오유수정프로그람과 같은 여러가지 편리와 봉사를 제공한다. 일반적으 
로 이 봉사들은 조작체계의 실제적인 부분이 아니지만 조작체계에 의하여 접근 
될수 있는 편의프로그람의 형태로 존재한다. 

• 프로그람집행 : 많은 과제들은 프로그람집행으로 수행될것을 요구한다. 명령들파 
자료는 주기억기에 넣어 져야 하고 입출력장치들과 파일들은 초기화되여야 하며 
다른 자원들이 준비되여야 한다. 조작체계는 사용자들에 대하여 이 모든것을 조 
종한다. 

• 입출력장치에 대한 접근: 매 입출력장치들은 조작을 위하여 그자체의 고유한 명 
령 묶음이 나 조종신호들을 요구한다. 조작체 계 는 프로그람작성 자가 간단한 읽 기 
와 쓰기로서 생각할수 있게 세부적인 처리를 진행한다. 

• 파일에 대한 조종접근: 파일의 경우에 조종은 입출력장치의 본질(디스크구동기, 
레프구동기)뿐아니 라 기 억매체의 파일형식 에 대 하여 인식하여 야 한다. 또한 조 
작체계는 세부에 대하여 조사한다. 더우기 다중-동시사용자를 가지는 체계인 경 
우에 조작체 계는 파일에 대 한 접근을 조종하는 보호기구를 제공할수 있다. 

• 체계접근: 공유 혹은 공동체계인 경우에 조작체계는 전반적인 체계와 지적된 체계 
자원들에 대한 접근을 조종한다. 이 접근기능은 권한이 없는 사용자로부터의 자원 
들과 자료보호를 제공하여야 하며 자원충돌에 대한 경쟁을 해결하여야 한다. 

• 오유검출과 응답: 콤퓨터체계가 작업하는 동안 여러가지 오유가 발생 할수 있다. 
이것들은 기억기오유 혹은 장치결함，불완전한 기능들과 같은 내적 또는 외적하 
드웨어오유들과 산수연산의 자리넘침, 금지된 기억주소를 접근하려는 시도, 응 
용프로그람의 요구를 만족시키는 기능이 조작체계에 없는것과 같은 쏘프트웨어 
의 여러가지 오유들을 포함한다. 매 경우에 조작체계는 응용프로그람집행에서 
자그마한 충격으로 인한 오유조건들을 제거할수 있어야 한다. 이것은 오유를 일 
으키는 프로그람을 끝내 는것 으로부터 조작을 재시험 하고 응용프로그람의 오유를 
간단히 통보하는것까지의 범위에 속한다. 

• 평가: 훌륭한 조작체계는 여러가지 자원들과 응답시간과 같은 감시프로그람성능 
파라메터들에 대한 사용통계들을 수집할수 있다. 임의의 체계에서 이 정보는 앞 
으로의 환경 에 대 한 요구를 기 대 하며 성능을 개선하기 위 하여 체계 를 개조하는 
데 쓸모 있다. 다중사용자체계에서 이 정보는 선전목적에 사용될수 있다. 

자원관리 자로서의 조작체계 

콤퓨터는 자료의 전송, 보관 그리고 처리와 이러한 기능들의 조종을 위한 자원들 
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의 묶음이다. 조작체계는 이 자원들을 관리한다. 

자료의 전송，보관 그리고 처리를 조종하는것이 조작체계라고 말할수 있는가? 하 
나의 관점으로부터 대답은 긍정적 이 다. 즉 콤퓨터의 자원들을 관리하기때문에 조작체 
계는 콤퓨터기본기능들의 조종으로 된다. 그러나 이 조종은 기묘한 방법으로 진행된다. 
보통 조종기구는 조종되는 외부적인것 혹은 적어도 조종되기 위하여 명백하게 갈라 진 
부분으로 생각한다(실례로 존재하는 가열체계는 열발생기와 열분배장치들로 완전히 구 
별된 자동온도조절장치에 의하여 조종된다.). 이것은 조종기구가 다음의 두가지 례외 
적 인 측면을 가지는 조작체계와는 다르다. 

• 조작체계는 보통 를퓨터쏘프트웨어와 같은 방법으로 작용한다. 즉 처리장치에 
의 하여 실현되 는 프로그람이 다. 

• 조작체계는 자주 조종을 포기하며 조종을 회복하기 위하여 처리장치에 의거한다. 

사실상 조작체계는 콤퓨터프로그람에 불과하다. 다른 콤퓨터프로그람과 같이 조작 
체계는 처리장치에 대하여 명령들을 제공한다. 기본차이는 프로그람의 목적에 있다. 
조작체계는 다른 체계자원의 리용과 다른 프로그람집행의 동기화로 처리장치를 직접 
관리한다. 그러나 처리장치는 일부 프로그람의 집행을 위하여 조작체계프로그람의 집 
행을 중지하고 다른 프로그람을 집행한다. 따라서 조작체계는 일부《필요한》작업집행 
을 위하여 처 리장치에 대한 조종을 포기하고 처 리장치가 다음의 부분작업을 진행하도 
록 준비하는데 필요한 충분한 조종을 다시 진행한다. 이 모든것에 대한 기구는 아래로 
내려 가면서 명백히 하려고 한다. 

그림 7-2 는 조작체 계 에 의하여 관리 되 는 주요자원들을 보여 준다. 조작체 계 부분은 


| I 八)조종기 ■ 
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그림 7-2. 조작체계의 자원관리 
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주기억기에 있다. 이것을 핵심부라고 하는데 여기에는 조작체계에서 제일 많이 리용되 
는 기능들과 주어 진 시간에 현재 리용되고 있는 조작체계의 다른 부분들이 들어 있다. 
이 자원 (주기 억 기)의 할당은 앞으로 보게 되겠지만 조작체 계 와 처 리 장치 에서의 기 억 기 
관리 하드웨 어 에 의 하여 공동으로 조종된 다. 조작체 계 는 입 출력 장치 가 언제 집 행 프로그 
람에 의해 리용되는가를 결정하며 파일의 사용과 파일에로의 접근을 조종한다. 처리장 
치 그자체는 자원이며 개별적인 사용자프로그람의 집행에 얼마만한 처리장치시간이 걸 
리는가는 조작체계에 의해 결정된다. 다중처리장치체계인 경우에 이러한 결정은 모든 
처리장치들에서 진행해야 한다. 

2. 조작체계의 형태 

여러가지 류형의 조작체계를 구분하기 위하여 몇가지 주요특징들을 리용한다. 그 
특징들은 두개의 독립적인 류형들로 나눌수 있다. 첫번째 류형은 체계가 묶음형인가， 
호상작용형 인가에 따르는 분류이 다. 호상작용체 계 에서 사용자 혹은 프로그람작성 자는 
일감의 집 행을 요구하거 나 처 리요구를 집행 하기 위 하여 건반이 나 영상표시 장치와 갈은 
말단을 통하여 콤퓨터와 직접 대화를 진행한다. 더우기 사용자는 응용프로그람의 성질 
에 따라 일감이 집행되는 동안 콤퓨터와 통신을 진행할수 있다. 묶음처러체계는 호상작 
용체계와 반대 이 다. 사용자프로그람은 다른 사용자로부터 제공되는 프로그람과 함께 묶 
음처리되며 콤퓨터조작수에 의하여 조작된다. 프로그람이 완료된 다음 결과는 사용자에 
게 인쇄되여 나온다. 오늘날 순수한 묶음처리체계는 거의 없다. 그러나 여기서 묶음처리 
를 간단히 설명하는것은 동시대의 조작체계를 리해하는데 어느 정도 필요할것이다. 

두번째 류형은 체계가 다중프로그람방식을 리용하겠는가 안하겠는가에 따르는 분 
류이다. 다중프로그람방식은 처리장치가 한번에 여러개의 프로그람을 가능한껏 더 효 
률적으로 집행하게 하는것이다. 여러개의 프로그람들이 기억기에 넣어 지며 처리장치 
는 이것들을 빠른 속도로 절환하여 처 리 한다. 이와 다른 한가지는 단일프로그람방식체 
계로서 한번에 하나의 프로그람밖에 집행하지 않는다. 

초기체계 

1940 년대 말부터 1950 년대 중엽 까지 기 간에 나온 초시 기 콤퓨터들에서 는 프로그람 
작성 자가 콤퓨터하드웨 어와 직 접대 화를 진행하였는데 그 리유는 조작체 계 가 없었기때 
문이 였 다. 이 처 리 장치 들은 영 상표시장치 , 빗 장스위 치，여 러 가지 류형 의 입 구장치 로 
이루어 진 조종탁과 인쇄기로부터 조종을 받아 동작하였다. 처 리장치명 령으로 작성된 
프로그람은 입력장치(즉 카드읽기장치)를 통하여 넣어 졌다. 만일 오유가 있어 프로그 
탐이 정지되였다면 그 오유조건은 표시등을 켜는 방법으로 알려 주었다. 프로그람작성 
자는 등록기들과 주기억기들을 검사하여 오유원인을 결정하였다. 만일 프로그람이 정 
상적 으로 완료되면 그 결과는 인쇄기 에 출력되였다. 초기 에 나온 이 체계들은 두가지 
기 본문제 점 을 제 기하였 다. 

• 일 정 작성 : 모든 설 치 들은 처 리 장치 시 간을 예 약하기 위 하여 계 약서 를 사용하였 다. 
일반적 으로 사용자는 30 분의 배수로 된 시 간블로크로 계 약을 하였다. 사용자는 
1시간 예약하고 45분내에 끝낼수 있다. 이것은 를퓨터시간이 랑비되는것으로 되 
였다. 다른 한편 사용자는 할당된 시간내에 끝내지 못하는 문제들을 집행시킬수 
있으며 이 경우에는 그 문제를 풀기전에 강제로 정지시켜야 하였다. 

• 설치시간 : 일감이라고 하는 단일프로그람은 기억기에로 고급언어프로그람(원천프 
로그람)과 번역프로그람의 넣기，번역된 프로그람(목적프로그람)의 기억，목적 
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프로그람과 공동함수들을 함께 련결하는것을 포함하여야 한다. 이 매 단계들은 
테프의 설치나 해제 혹은 카드설치를 포함할수 있다. 만일 오유가 발생하면 사 
용자는 일반적으로 설치순서의 시작으로 되돌아 가야 하였다. 따라서 생각하던 
많은 시간이 집행을 위한 프로그람의 설치에 랑비되였다. 

이 연산방식은 사용자가 순차로 를퓨터를 접근한다고 하여 순차처 리 라고 불렀다. 
이 시간이 지나감에 따라 여 러가지 체계프로그람도구가 개발되면서 순차처리를 보다 
효과적으로 진행하려는 시도들이 있었다. 이러한 도구들로는 모든 사용자들이 공동쏘 
프트웨 어 로 쓸수 있는 공동함수서 고，련결 편집 기，적 재 기 , 오유수정 기 , I/O 구동기 루린 
들이 있다. 

간단한 목음체계 

초기의 처리장치들은 대단히 가격이 높았으므로 처리장치의 리용률을 최대로 하는 
것이 중요하였다. 일정작성과 설치시간때문에 랑비되는 시간은 무시할수 없었다. 

이 문제를 개선하기 위하여 단순한 묶음처 리조작 
체계가 개 발되 였다. 감시 프로그람이 라고도 하는 
이러한 조작체계가 개발됨으로써 사용자는 더는 
처 리장치를 직접 접근하지 않아도 되게 되였다. 
오히 려 사용자는 감시프로그람을 리용하기 위하여 
카드나 레프에 들어 있는 일감을 콤퓨터조작수에 
게 넘겨 주며 조작수는 그 일감들을 순서대로 묶 
어 그 전체 묶음을 입력장치에 넣 었다. 

이것이 어떻게 동작하는가를 리해하기 위하여 두 
가지 측면 즉 감시프로그람과 처리장치의 견지에 
서 고찰해 보기로 하자. 감시프로그람의 견지에서 
고찰해 보면 사건의 처리과정을 조종하는것이 감 
시 프로그람이 다. 그러 므로 감시 프로그람의 대 부분 
은 집 행 하는 동안 주기 억기 에 상주하고 리용될수 
있어 야 한다(그림 7-3). 이 부분을 상주감시프로그 
람이라고 한다. 감시프로그람의 나머지는 어떤 일 
감의 시작에서 사용자프로그람의 보조루린으로 넣 
어 지는 편의프로그람이나 일반기능들로 이루어 
진 다. 감시 프로그람은 입 력 장치 로부터 (대 표적 으로 
카드읽 기 장치 혹은 자기레 프장치 ) 일 감을 단번 에 읽 어 들인 다. 읽 어 들인 다음 현재 일 
감이 사용자프로그람구역에 배치되고 조종이 이 일감에로 옮겨 진다. 일감이 완성되면 
다음일감을 직접 읽 어 들이는 감시프로그람에 조종을 넘긴다. 매 일감의 결과들은 사 
용자에 게 넘 겨 주기 위하여 출력 된 다. 

처 리 장치 의 견지 에서 이 순서 를 고찰하자. 어 떤 시 점 에서 처 리 장치 는 감시프로그 
탐을 기억하고 있는 주기억기의 부분으로부터 명령을 집행한다. 이 명령들은 주기억기 
의 다른 부분에 다음일감을 읽 어 들인다. 일 단 한 일감이 읽어 지면 처 리 장치는 사용 
자프로그람시작에서 집 행을 계속하도록 처 리 장치 에 지시하는 분기명 령을 감시프로그람 
에서 맞다들리게 된다. 처 리장치는 프로그람의 집행끝이나 오유조건을 만날 때까지 사 
용자프로그람에서 명 령을 집행한다. 어떤 사건이 감시프로그람에서 다음명 령 을 꺼 낸다 
고 하자. 《조종이 일감으로 넘 어 간다.》는 말은 처 리 장치 가 현재사용자프로그람에서 
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명령을 꺼내여 집행한다는것을 의미하며 《조종이 감시프로그람으로 되돌아 간다.》는 
말은 현재 처 리장치 가 감시 프로그람으로부터 명 령을 꺼내여 집행 한다는것을 의미 한다. 

감시프로그람이 일정작성문제를 조종한다는것을 명백히 해야 한다. 일감묶음은 대 
기하게 되며 일감들은 빈 시간이 없이 가능한껏 빨리 집행된다. 

일감이 시간을 어떻게 설정하는가? 감시프로그람은 이것을 원만히 수행한다. 매 일 
감에 대하여 명령들은 일감조종언어 ( JCL ) 에 포함된다. 이것은 감시프로그람에 명령들 
을 제공하기 위하여 리용되는 프로그람작성언어의 특수한 형태이다. 이 프로그람작성 
언어는 사용자가 FORTRAN 으로 작성된 프로그람과 그 프로그람에서 사용하는 자료에 
의존하고 있는것과 같이 리용할수 있다. 매 FORTRAN 명 령과 자료항목은 개 별적 인 카 
드나 레 프의 개 별적레 코드에 기 억된다. FORTRAN 과 자료행 외 에 일 감은 “$” 로 시 작한 
일감조종명 령을 가지고 있다. 일감의 종합적 인 양식은 다음과 같다. 

$JOB 

$FTN 

• 1 FORTRAN 명 령 

$LOAD 

$RUN 

자료 

SEND 

이 일 감을 집 행 하기 위하여 관리프로그람은 $FSN 선을 읽 어 들이고 그의 기 억 기 로 
부터 적 당한 번 역프로그람을 읽 어 들인다. 번역프로그람은 사용자프로그람을 목적코드 
로 변환시키 는데 그것은 기 억 기 나 탄창기 억 기 에 기 억된다. 그것 이 기 억 기 에 기 억되 면 
연산은《번역，넣기, 집행》으로 된다. 레프에 기억되는 경우 $LOAD 명령 이 필요하다. 
번역동작후에 조종을 다시 얻는 감시프로그람이 이 명령을 읽어 들인다. 감시프로그람 
은 목적프로그람을 번역프로그람위 치 로 읽 어 들이는 넣 기프로그람을 기 동시키 며 그에 
조종을 절환한다. 이 방법에서는 단 하나의 이런 보조체계가 남아서 집행된다고 하여 
도 주기억기의 한 토막이 여 러개 보조체계들에서 공유될수 있다. 

감시프로그람이 나 묶음조작체 계 는 간단한 콤퓨터 프로그람이라고 볼수 있다. 이 것은 
조종을 번갈아 주고받기 위하여 주기억기의 여러 부분들로부터 명령을 꺼내는 처리장 
치의 능력에 관계된다. 하드웨 어의 다른 특성들에 대한 요구는 다음과 갈다. 

• 기억기보호: 사용자프로그람이 집행중일 때 감시프로그람을 포함하는 기억기부 
분을 변경시키지 말아야 한다. 이 런 시 도가 생 기면 처 리 장치하드웨 어는 오유를 
검 출하고 감시프로그람에 조종을 절 환한다. 그러 면 감시프로그람은 일 감을 중지 
하고 오유통보를 출구하며 다음일감을 읽어 들인다. 

• 시 계 : 시 계 는 독점 체 계 로부터 단일 일 감을 막는데 리 용된 다. 시 계 는 매 일 감의 
시 작에 서 설정 된 다. 만일 시 계 가 멎 었 다면 새 치 기 가 발생 하며 조종은 감시 프로 
그람에로 돌아 간다. 

• 특권명 령 : 어떤 명 령들은 특권으로 구별되 고 감시프로그람에 의 하여서 만 집 행된 
다. 만일 처 리 장치 가 사용자프로그람을 집 행하는 동안 이와 같은 명 령을 만난다 
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면 오유새 치기가 발생 한다. 특권명령 들은 입출력명 령 이므로 감시 프로그람은 모 
든 입출력장치들에 대한 조종을 맡아 진행한다. 실례로 이것은 사용자가 우연히 
다음일 감으로부터 일 감조종명 령 을 읽 는것 을 막는다. 만일 사용자프로그람이 입 
출구수행을 요구하면 감시프로그람이 이 조작을 수행하게 하여 야 한다. 사용자 
프로그람을 집 행 하는동안 특권명 령을 만나면 처 리장치 하드웨 어는 이것을 오유로 
보고 감시프로그람에로 조종을 절환한다. 

• 새치기: 초기콤퓨터모델들은 이 능력을 가지지 못하였다. 이 특성은 조종을 중 
단하고 사용자프로그람으로부터 조종을 회복하는데 더 유연한 조작체계를 제공 
한다. 

처 리 장치 시 간은 사용자프로그람의 집 행 과 감시 프로그람의 집 행 사이 에 서 교체 된 다. 
여기에는 두가지 상황이 존재한다. 즉 주기억기의 일부는 감시프로그람에 할당되며 일 
부 처 리장치시간은 감시프로그람에 종사한다. 이것들은 둘다 우에서 고찰한 특성들로 
이루어 진다. 이 특성들에 의하여 간단한 묶음체계는 콤퓨터의 리용률을 증대시킨다. 

다중처리프로그람목음체계 

간단한 묶음조작체 계 가 제 공하는 자동일감순서 인 경 우에 처 리 장치 는 때때로 빈동 
작을 한다. 문제 는 입 출력 장치 가 처 리 장치 에 비 하여 뜨다는것 이 다. 그림 7-4 는 표현식 
을 설명한다. 계산은 파일레코드를 처리하고 실현하는 프로그람에 집중된다. 이 실례 
에 서 콤퓨터 는 자료전환을 끝내 는 입 출력 장치 를 기 다리 는데 자기 시 간의 9將를 소비한 
다. 그림 7-5 기는 이 상태의 실례이다. 처리장치는 입출력명령에 도달할 때까지 얼마만 
한 집행시 간을 가진다. 그다음 계속 집행하기 앞서 입출력명 령 이 완료될 때까지 기 다 
려 야 한다. 

이 비 효과적 인 과정 은 필 요 없 다. 조작체 계 (상주하고 있는 감시프로그람)와 하나 
의 사용자프로그람을 기 억시키는데는 충분한 기 억기 가 있어 야 한다. 조작체계와 두개 
의 사용자프로그람을 기억시킬 공간이 있다고 가정하자. 한개 일감이 입출력요구를 기 
다릴 때 처 리장치는 입출력을 기 다리지 않는 다른 일감으로 전환할수 있다(그림 7-5 
L ). 더우기 3，4 또는 그이상의 프로그람을 기억하고 그들사이에서 절환하도록 하기 
위 해 서 는 기 억 기 를 확장해 야 한다(그림 7-5 n ). 

하나의 레 코드읽 기 0 . 0015 초 

100 개 의 명 령 실 행 0. 0015 초 
하나의 레 코드쓰기 0.0015 초 

총 시간 0.0031 초 


, ᄋ s 0.0001 

CPU 리 용률=- =0.032=3.2% 

0.0031 

그림 7-4. 체계응용실례 


그 처리를 다중프로그람방식 또는 다중과제방식이라고 한다. 이것은 현대조작체계 
의 기 본주계 이다. 

다중프로그람체계의 우점을 설명 하기 위하여 실례를 들어 보자. 256 K 의 기 억기 (조 
작체계가 쓰지 않는)와 디스크，말단인쇄기를 가진 콤퓨터를 고찰하자. 3 개의 프로그 
람 JOB 1, JOB 2, JOB 3 이 표 7-1 에 표시 한 속성 을 가지 고 같은 시 간에 집 행 된다. JOB 2, 
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JOB 3 이 극소형처 리 장치 를 요구하고 계 속하여 JOB 3 이 디 스크와 인쇄 기 를 요구한다고 
하자. 간단한 묶음환경에서 이 일감들은 련속적으로 집행된다. 


|집 행 | 기 다림_| 집 행 | 기 다림 


-1) 

-卜 


기 다림 

두도"! 

기다림 

기다림|¥히 기다림 


기다림 

1집，행1집 9 행 기다림 

1집，행 |집 ? 행 | 

기다림 


|집행| 기다■림 _ |집행 | 기다성 

기다림!직 기다림 _ 기다림 

기다림 ff§] 기다림_資資3 기다림 


를를를■를를를 


C) 

그림 7-5. 다중프로그람집행의 실례 
T- 단일프로그람집행， "L- 두개 프로그람의 다중집행， 
n-3 개 프로그람의 다중집 행 

따라서 J 0 B 1 은 5분동안에 완성 되 고 J 0 B 2 는 5분이 될 때 까지 기다려야 하며 그때 
로부터 15 분후에 완성 된 다. J 0 B 3 은 20 분후에 시 작되 며 그것 이 시 작된 때 로부터 30 분 
동안에 완성된다. 평균자원리용，생산액，응답시간은 표 7-2 의 렬에서 보여 준다. 매 
장치의 리용률은 그림 7-6 에서 보여 준다. 평균 30 분시간주기 이상이 요구될 때 모든 
자원들에 대 하여 일 반적 으로 리 용되 지 않는다는것 은 명 백하다. 

표 7-1. 간단한 프로그람집 행속성 



JOB1 

JOB2 

JOB3 

일감형래 

복잡한 계산 

입출력 부하 

입출력 부하 

수행 시간 

5 분 

5 분 

5 분 

기억 기요구 

50 K 

100 K 

80 K 

디스크가 필요한가 

필요 없음 

필요 없음 

필요 있음 

말단이 필요한가 

필요 없음 

3■요 J [음 

필요 없음 

인쇄기가 필요한가 

필요 없음 

필요 없음 

필요 있음 
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JOB 3 은 J 0 B 1 의 1/2 시 간동안에 끝난다. 세 일감은 15 분내 에 끝나게 된다. 그림 7-7 
에서 보여 준 히스토그람으로부터 엄은 표 7-2 의 렬은 다중프로그람을 시험할 때 엄은 
것이다. 

단순한 묶음체 계와 비 교해 보면 다중프로그람묶음처 리체 계는 일정한 콤퓨터하드웨 어 
의 특성에 의존하지 않으면 안된다. 다중프로그람에 쓰이는 가장 주목할만한 부가적 인 
특징 은 입 출구새 치 기 와 DMA 를 지 원하는 하드웨 어 이 다. 입 출력 을 구동하는 새 치 기 와 
혹은 DMA 를 가짐 으로써 처 리 장치는 하나의 일감에 대 한 입출력지 령 을 출력할수 있으 
며 입출력이 장치조종회로에 의하여 수행되는 동안 다음일감에로 집행을 옮길수 있다. 
입출력조작이 완료될 때 처 리장치는 새 치기를 받으며 조종이 조작체계안의 새치기조종 
프로그람에로 넘어 간다. 조작체계는 이때 다른 일감에로 조종을 넘기게 된다. 

다중프로그람조작체 계 는 단일프로그람 혹은 단일프로그람작성체계와 비 교하면 명 
백히 복잡하다. 집 행 준비 된 여 러 가지 일 감들을 가지 자면 일 감은 주기억 기 에 있 어 야 하 
며 기억기관리의 일부 형식을 요구하여야 한다. 추가적으로 만일 여러 일감들이 집행 
준비되였다면 처리장치는 집행을 위한 한 프로그람을 결정해야 하는데 일정작성으로부 
터 일부 알고리듬이 요구된다. 이 개념들은 뒤에서 서술한다. 

시분할체계 

다중프로그람체 계 를 리용함으로써 묶음처 리 는 매 우 효과적 인것 으로 되 였 다. 그러 나 
적지 않은 일감들은 사용자가 콤퓨터와 직접 대화하는 방식을 제 공해 줄것을 요구한다. 
실지 로 업무처 리와 같은 일부 작업들에 대 한 대화방식 (호상작용방식)은 본질적 인 문제 
이다. 

오늘날 대화식콤퓨터처 리기구에 대 한 요구는 전용마이크로콤퓨터 를 리 용하여 충족시 
키고 있다. 이 러한 선택방식은 1960 년대에는 적용할수 없었는데 그 당시는 대부분의 콤 
퓨터들의 규모가 크고 값이 비쌌기때문이다. 그대신에 시분할체계가 개발리용되였다. 

다중프로그람은 한번에 다중묶음일감들의 조종을 허 락하며 호상작용하는 일감들을 
다중으로 조종하는데 리 용할수 있었 다. 그후 이 수법 을 시 분할이라고 하였는데 그 리 
유는 처 리 장치시 간이 다중사용자들에 의하여 공유되 기때 문이 다. 시 분할체 계 에서 다중 
사용자는 조작체 계 가 짧은 시 간에 매 사용자프로그람의 집 행 혹은 계 산량을 처 리하는 
것으로 말단을 통하여 동시에 체계를 접근할수 있다. 따라서 한번에 n 명의 사용자가 
봉사를 요구한다면 매 사용자는 조작체 계 의 조종시 간을 고려하지 않으며 유효한 콤퓨 
터속도를 1 /n 로 볼수 있다. 그러나 상대적으로 사람의 반응시간이 느리므로 적합하게 
설계된 체계에서 응답시간은 사용하는 콤퓨터에 알맞춤해야 한다. 

묶음식 다중프로그람방식과 시분할방식은 다중프로그람방식 에서 리용한다 . 기본차이 
점을 표 7-3 에 주었다. 


표 7-3. 다중프로그람방식과 시분할방식의 차이점 



묶음다중프로그람 

시간공유 

원리적인 목적 

최소처리장치사용 

최소응답시간 

조작체계에 의한 명령원천 

일감과 제공된 일감조종언 
어명령 

말단에 넣어 진 명령 
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제 2 절. 일정작성 

다중프로그람작성 에 서 기 본은 일 정 작성 이 다. 실제 로 일 정 작성 에 는 4 가지 형 태 가 
있 다(표 7-4). 앞으로 이 것 들을 조사한다. 그러 나 무엇보다 먼저 프로쎄 스에 대 한 개 념 
을 소개 한다. 이 용어 는 1960 년에 Multics 조작체계설계 에서 처음 쓰이 였다. 이것은 일 
감보다 얼마간 더 일반적 인 용어 이 다. 많은 정의들은 다음의것들을 포함하는 프로쎄스 
가라는 용어를 주고 있다. 

• 집행상태의 프로그람 

• 프로그람의 “기동하는 상태 ” 

• 처 리장치가 할당된 실체 

이 개 념들은 고찰과정 에 더 명백 해 질것 이다. 

1. 긴시간일정작성 

긴시 간순서기는 체 계 에서 처 리를 위하여 어느 프로그람이 승인되겠는가를 결정한 
다. 따라서 이것은 다중프로그람작성의 등급(기억기에서 많은 프로쎄스들)을 조종한다. 
일 단 승인되 면 일 감 혹은 사용자프로그람은 프로쎄 스로 되 고 짧은시 간순서 를 위한 대 
기렬이 증가된다. 일부 체계들에서 새롭게 만들어 진 프로쎄스는 중간시간순서를 위한 
대 기렬을 증가시 키 는 어 떤 경 우에 교환해 나가는 조건으로 된다. 

체계묶음에서 혹은 일반조작체계부분의 묶음을 위해 새롭게 제출된 일감들은 디스 
크로 토정 이 정 해 지며 묶음대 기렬에 유지한다. 긴시 간일정 작성 은 그것 이 가능할 때 
대 기렬로부터 프로쎄스들을 창조한다. 여기 에 동반되는 두개의 결정 이 있다. 우선 순 
서 는 조작체 계 가 하나 혹은 그이 상 추가적 인 프로쎄 스들을 가질수 있다는것 을 결정하 
여 야 한다. 두번째 순서 는 접 수하기 위한 일 감 혹은 일 감들을 결정 하고 프로쎄 스로 돌 
려야 한다. 리용되는 기준은 중요성, 기대되는 집행시간，입출력요구를 포함한다. 

시분할체계에서 호상 작용하는 프로그람들에 대하여 프로쎄스요구는 사용자가 체 
계 와의 련결을 시도할 때 발생된다. 시 분할사용자들은 단순히 대 기렬을 늘이 지 않으며 
체계가 그것들을 접수할 때까지 기다림을 유지한다. 오히려 조작체계는 몇개의 미리 
정의된 포화의 크기를 리용하여 체계 가 포화될 때까지 권한을 부여한 사용자들을 모두 
접수할수 있다. 이 시점에서 련결요구는 체계가 가득차 있으므로 사용자가 다시 시도 
해 야 한다는 통보문과 맞다들게 된다. 


표 7-4. 일정작성형래 
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2. 중간시간일정작성 

중간시간일정작성은 제 3절에서 서술된 교환기능의 부분이다. 일반적으로 교환입구 
결정은 다중프로그람등급관리 에 대 한 요구에 기 초한다. 가상기 억을 사용하는 체 계 에서 
기 억기관리 는 역시 흐름이 다. 따라서 교환입구결정 은 교환출구처 리의 기 억기요구를 고 
찰한다. 

3. 짧은시간일정작성 

높은준위일정작성은 상대적으로 드물게 집행되며 새로운 처리를 선택할것인가 말 
것인가 어느것을 취할것인가 하는 조잡한 결정들을 진행한다. 또한 배포 기라고도 하는 
짧은시간일정작성은 자주 집행되며 다음번에 어느 일감을 집행시키겠는가 하는 정확한 
결심을 내리게 한다. 

프로쎄스상태 

짧은시간일정작성의 조작을 리해하기 위하여 프로쎄스상태의 개념을 고찰하여야 한 
다. 프로쎄스의 생존기간 그의 상태는 여러번 변한다. 어떤 시점에서 이 상태는 상태 
로 귀착된다. 주기상태는 그것이 그 시점에서 상태를 정의하는 어떤 정보가 존재한다 
는것을 암시하기때문에 리용된다. 최소로 프로쎄스에 대한 5 개의 정의된 상태들이 있 
다(그림 7-8). 

• 새로 시작: 프로그람이 높은준위순서기에 의하여 허가되였지만 아직 집행을 위하 
여 준비되지 못함. 조작체계는 프로쎄스를준비상태로 옮겨서 초기화한다. 

• 준비 : 프로쎄 스는 집 행 을 위 한 준비 를 하여 프로쎄 스에 로의 접 근을 기 다린 다. 

• 집행: 프로쎄스가 처리장치에 의해 집행되고 있다. 

• 기다림 : 프로쎄스는 입출구와 같은 일부 체계에 대한 대기로 하여 집행을 중지한다. 

• 중지 : 프로쎄스가 끝나게 되며 조작체 계 로부터 분리되 여 무효로 된다. 



체 계 에서 매 프로쎄 스를 위하여 조작체 계는 프로쎄 스의 상태 를 포함하고 있는 정보 
와 프로쎄스집행에 필요한 다른 정보들을 유지하여야 한다. 이 목적을 위하여 매 프로 
쎄스는 프로쎄스조종블로크 (그림 7-9) 에 의한 조작체계에서 나타나는데 일반적으로 다 
음의것들을 포함한다. 

• 식별자: 현재의 매개 프로쎄스가 유일한 지적자를 가진다. 

• 상태 : 프로쎄 스의 현재 상태 ( new , ready 등) 
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• 우선권: 관계가 있는 우선권준위이다. 

• 프로그람계수기: 집행되는 프로그람에서 다음명령의 주소가 있다. 

• 기억 기지 적 자: 기 억 기 에 서 프로쎄 스의 위치의 시 작 
과 끝이다. 

• 본문자료: 프로쎄스가 집행되는 동안 프로쎄스에서 
등록기들에 존재하는 자료가 있으며 그것들은 제 3 
편에서 론의된다. 이 자료가 프로쎄스의《문맥》을 
표현한다고 말하는것은 가능하다. PC 에 추가되는 
문맥자료는 프로쎄스가 준비상태를 벗어 날 때 복 
사된 다. 그것 들은 프로쎄 스에 의하여 회 복된 다. 

• I/O 상태 정 보 : 이 프로쎄 스에 할당된 입 출력 요구들, 

입 출력 장치 (테 프장치 ) 와 처 리 장치 에 할당된 파일 일 
감 등이 포함된다. 

• 계 산정 보 : 처 리 장치 시 간, 박자시 간, 극한시 간, 계 
수값 등이 포함된다. 

이 새 일감 혹은 집행을 위한 사용자요구를 시도할 
때 그것은 빈 프로쎄스조종블로크를 창조하며 새로운 상 
태 에서 프로쎄 스와 련계 를 맺는다. 그림 7 _9. 프로 쎄스조종블 로크 

일정작성기술 

기 억기 에서 조작체계 가 어 떻게 여 러 가지 일감들에 대 한 일정작성을 관리하는가를 알 
기 위해 그림 7-10 에서 간단한 실례를 생각해 보자. 이 그림은 주기억기가 어떻게 주어 
진 시점에서 구역분할되는가를 보여 준다. 물론 조작체계의 핵심부는 항상 상주한다. 부 
가적으로 A 와 B 를 포함하여 기억기부분에 할당된 많은 능동프로쎄스들이 있다. 

프로쎄스 A 가집행되는 시점에서 시작한다. 프로쎄스는 A 의 기억부분에 있는프 
로그람으로부터 명 령을 집행한다. 일부 그다음시점 에서 프로쎄스는 A 에서 명 령을 집 행 
하기 위해 중지하며 조작체계령역에서 명령을 집행한다. 이것은 3가지 원인을 가진다. 

• 프로쎄 스 A 는 조작체 계 에 로 봉사 (말하자면 입 출력 요구) 를 접 근한다. A 의 집 행 은 
이 접 근이 조작체 계 에 의하여 만족될 때 까지 중지 된 다. 

• 프로쎄스 A 는 새 치 기를 발생한다. 새 치 기는 프로쎄 스에 로의 하드웨 어발생신호이 
다. 이 신호가 검출될 때 프로쎄스는 A 집행을 중지하며 조작체계에 새치기조종 
을 전송한다. A 와 관련되는 여러가지 사건들이 중단을 일으킨다. 하나의 실례는 
특권명 령집 행 을 위한 시도와 같은 오유이다. 다른 실례 는 요구시 간 ( timeout ) 이 다. 
즉 처 리 장치점 유로부터 어 떤 하나의 프로쎄 스를 막기 위해 매 프로쎄스는 짧은 
기간에 처 리장치를 허가한다. 

• 주의 할것은 요구하는 프로쎄스 A 와 관련이 없는 일부 사건들이 새 치기를 발생 시 
킨다는것이다. 실례로 입출력조작의 완료를 들수 있다. 

어떤 경우에 결과는 다음과 같다. A 프로쎄스조종블로크에서 처 리장치는 현재의 상 
태자료와 A 의 프로그람계수기를 복사한 다음 조작체계 에서 집 행을 시 작한다. 조작체 계 
는 입 출구조작시 작과 갈은 시 간일정 작성 부분이 프로쎄 스다음에 집 행 할것 을 결정 한다. 
이 실례 에서 B 를 선택하였다. 조작체계는 처 리장치 에 B 의 상태자료를 기 억하게 지시하 
며 묘의 집행을 그만 두게 한다. 


식 별 자 

~一~ 

우 선 권 


프로그람계수기 



본문자료 


I/O 상태 정 보 


계 산정 보 
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이 간단한 실례는 짧은시간일정작성의 기본기능을 강조한다. 그림 7-11 은 다중프로 
그람과 프로쎄 스일 정작성 을 포함하는 조작체 계 의 기 본요소를 보여 준다. 조작체 계 는 
새 치기 가 나타나면 새 치기처 리기 에 처 리 장치의 조종을 주고 봉사접근이 나타나면 봉사 
접근처 리기 에 조종을 넘긴다. 일 단 새 치 기나 봉사접근이 처 리되 면 짧은시 간일정 작성은 
집행처리로 돌아 간다. 

그 일 감을 집 행 하기 위하여 조작체 계 는 대 기렬의 수를 검 사한다. 매 대 기렬은 일 
정한 자원을 기 다리는 처 리들의 모임 이 다. 긴시 간대기 렬은 체 계의 사용을 기 다리는 모 
임이다. 그것은 짧은시간일정작성과 같이 형성된다. 일반적으로 매 처리에 일정한 시 
간을 주었다가 되돌리는 round-robin 알고리듬으로 수행된다. 우선준위도 사용된다. 끝 
으로 매 입출력장치에 대해서 입출구대기렬이 있다. 하나이상의 처리가 갈은 입출구장 
치사용을 요구할수 있다. 매개 장치사용을 기다리는 모든 처리들은 그 장치의 대기렬 
에 놓인다. 

그림 7-12 는 프로쎄스들이 조작체계의 조작밑에 콤퓨터에서 어떻게 진행되는가를 
보여 준다. 매 개 처 리요구(묶음형 일감, 사용자가 정의한 호상작용일감)는 긴시 간대기 







봉사접근 
조종기 


짧은기간 
일정 작성 


프로쎄 스로부터 
새치기 一 


I 八3로부터 새 치 기_ 


프로쎄 스에 로 
보내기 

그림 7-11. 다중프로그람에 서 조작체 계 의 기 본구성 요소 

렬에 들어 간다. 자원이 사용가능하므로 처리요구가 처리로 되고 준비상태로 되며 짧 
은시 간대기 렬에 들어 간다. 처 리 장치 는 집 행하는 조작체 계명 령과 집 행하는 사용자처 리 
를 서로 번갈아 수행한다. 조작체 계 가 조종상태 에 있을 때 짧은시 간대기 렬에 있는 어 
느 프로쎄스를 다음번에 집행시킬것인가를 결정한다. 조작체계가 자기의 과제를 끝내 
면 처 러장치 를 선택한 프로쎄 스에 로 넘 긴다. 

이미 언급된바와 같이 집행되는 프로쎄스는 여러가지 리유로 중지될수 있다. 프로 
쎄 스입 출구요구로 중지 되 면 해 당한 입 출구대 기 렬 로 들어 간다. 요구시 간이 나 조작체 계 


프로쎄스 
요구 



그림 7-12. 처 리 장치 일 정 작성 의 대 기 그림 표현 

가 긴급한 봉사에 응해야 하는것으로 인하여 프로쎄스가 중지되였다면 준비상태에 놓 
이 며 짧은시 간기 다림렬 에 넣 어 진다. 

끝으로 조작체 계 는 입 출력대 기렬도 관리한다. 입 출력연산이 완성 되 면 조작체 계 는 
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입출구대기 렬에서 해 당 프로쎄스를 다음기 다림프로쎄스로 선택 하여 그 프로쎄스가 요 
구하는 입출력장치에 신호한다. 


제 3 절. 기억기관리 

단일사용자체 계 에서 주기억은 2개 부류로 갈라 지는데 하나는 조작체 계 를 위한것 이 
고 다른것은 현재 집행되는 프로그람용이다. 다중사용자체계에서 기억기의《사용자》부 
분은 여 러 프로쎄 스에 적 용하여 편 리하게 세 분화된 다. 이 세 분화과제 는 조작체 계 에 의 
해 동적 으로 실현되며 이것을 기 억기관러라고 한다. 

효률적 인 기 억관리는 다중프로그람방식체 계 에서 가상기 억 방식이 다. 적은 량의 프로 
쎄 스만이 주기억 기 에 있 다면 이 때 모든 프로쎄 스들의 대 부분시 간은 입 출구대 기 로 되 며 
처리장치는 휴식상태에 있게 된다. 따라서 기억기는 가능한 여러개 처리를 기억기에 
넣 도록 효과적 으로 배 치하여 야 한다. 

1. 교환 

그림 7-12 에 대 하여 다시 고찰하여 3가지 기 다림 형 태 들을 론의하자. 즉 새 로운 프 
로쎄스에 대한 요구들을 등록하는 긴시간기다림렬，처리장치의 리용을 준비하고 있는 프 
로쎄 스들을 등록하는 짧은시 간기 다림 렬，처 리 장치 의 리 용에 준비 되 지 않은 프로쎄 스들을 
등록하는 여 러 가지 입출력기 다림렬들이 다. 이 정밀한 기계들은 입 출력동작이 계산보다 
더 느리므로 단일프로그람방식체계에서 처리장치는 많은 시간이 휴식상태로 된다. 

그러나 그림 7-12 에서의 배렬은 이 문제를 완전히 해결하지 못한다. 이 경우에 기 
억기가 여러개 프로쎄스를 유지하고 있고 처리장치가 어떤 치리공정이 기다림상태에 
있을 때 처리장치가 또 다른 프로쎄스로 이동할수 있다는것이 확실하다. 그러나 처리 
장치는 입출력보다 매우 빨라서 기억기에서의 모든 프로쎄스들은 입출력을 기다리는 
상태에 있는것이 일반적인것으로 된다. 그리 하여 다중프로그람방식에서 처리장치는 대 
부분 휴식상태에 있게 된다. 

방도는 무엇 인가? 주기억기는 확장될수 있으며 그리하여 더 많은 프로쎄스들을 가 
질수 있다. 그러나 이 방법에는 두가지 결함이 있다. 첫째로, 주기억기가 현재까지도 
값이 비싼것이다. 둘째로，기억기의 가격이 빨리 낮아 지는것만큼 기억기에 대한 프로 
그람들의 요구가 늘어 나는것이다. 따라서 큰 기억기는 많은 처리가 아니라 더 큰 처 
리 를 초래하게 된 다. 

다른 해결은 그림 7-13 에서 서술한 교환이다. 일반적으로 디스크에 기 억되는 프로 
쎄 스요구들은 긴시 간대기 렬을 가진다. 이 것 들은 공간이 리 용가능할 때 한번에 하나씩 
주기억기에 들어 온다. 프로쎄스들이 수행되면 주기억기에서 없어 진다. 처리들이 완 
수되는데 따라 주기억밖으로 나간다. 그러면 기 억 기의 처 리 들이 모두 준비 상태 (모든것 
은 입출구연산에 대하여 기다림을 가진다.)에 있지 않는 상황이 생긴다. 빈상태를 유 
지하기 보다 처리장치는 이 처리들중 하나를 디스크에서 중간대기렬로 내보낸다. 이것 
은 일시적 으로 기 억기 에서 나간 현존처 리들의 대기렬이 다. 조작체 계는 중간대기렬에서 
다른 처 리를 가져 오거 나 긴시 간대기렬로부터 새 로운 처 리요구를 받아 들인다. 그러면 
새 로 도착한 처 리 가 집 행 이 계 속된 다. 
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그러나 교환은 입출력조작이며 따라서 문제를 더 좋게가 아니라 나쁘게 할 가능성 
이 있다. 그러나 디스크입출력은 일반적으로 체계입출력보다 빠르므로 교환이 보통 동 
작을 제고한다. 가상기억기를 포함하여 더 기발한 착상이 간단한 교환동작을 개선한다. 
이것은 인차 론의된다. 그러나 먼저 구획분할과 페지화에 대한 설명이 있어야 한다. 


디스크기억^•치 



그림 7-13. 교체하기의 리용 
n - 간단한 일감일정작성, i _- 교체하기 


2. 구획분할 

사용가능한 기억기의 가장 간단한 구 
획분할방법은 그림 7-14 와 같은 고정크기 
구획을 사용하는것 이 다. 구획들이 고정된 
크기이지만 그것들이 같은 크기를 요구하 
는것은 아니다. 한개 처리가 기억기로 들 
어 오면 그것은 기억시킬 가능한 가장 작 
은 구획 을 차지한다. 크기 가 다른 고정 크 
기구획을 사용하여도 기억기조각이 있다. 

많은 경우 처리는 구획이 제공한 만큼 큰 
기억기를 요구하는것은 아니다. 실례로 
3 Mbyte 기 억 기 를 요구하는 처 리 는 4 M 구획 
을 차지하는데 (그림 7-14 l ) 1 M 조각은 
다른 처리가 사용한다. 

더 효과적 인 방법 은 가변크기구획 을 
사용하는것이다. 처리가 기억기에 들어 
오면 그것은 정확히 그가 요구하는것만한 
기억기를 요구하며 그이상은 필요 없다. 

그림 7-15 에 1 MB 주기억 을 사용하는 실 
례를 보여 주었다. 처 음에 주기억기는 조 
작체계구역을 제외하고는 비여 있다 (1). 

첫 세개의 프로쎄스들의 조작체계가 끝나 
는 위치로부터 시작하여 매개 처리가 중 그림 7-14. 6 4 MB 기억기의고정분배실례 
분한 공간을 차지 한다 (ᄂ，ᄃ， 5 ). 이때 4 •은크기의 분배， !_)- 서로다른크기의 분배 
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위 치주소를 포함하고 있다. 

• 자료항목의 주소 

• 분기명령에서 리용되는 명령의 주소 

그러나 이 주소들은 고정이 아니다. 그것들은 처리가 교환되여 들어 올 때마다 변 
한다. 이 문제를 풀기 위하여 론리주소와 물리주소를 구분한다. 론리주소는 프로그람 
의 시 작으로부터 의 상대 위 치 로 표현된 다. 프로그람에 서 의 명 령 들은 론리 주소만을 가진 
다. 물러주소는 주기억에서의 실지주소이다. 처리장치가 어떤 처리를 집행할 때 그것 
은 기준주소라고 하는 처리의 시작위치에 매개 론리주소를 더하여 론리주소를 물리주 
소로 자동적으로 변환한다. 이것이 처리장치의 장치적특징의 다른 한가지 실례이다. 
이 장치적특징의 정확한 성질은 기억기관리에 의존한다. 

3. 페지화 

같지 않은 고정크기 및 가변크기구획은 다 기억기사용에 비효과적이다. 그러나 기 
억기를 상대적으로 작은 같은 고정된 크기의 덩어리로 가르고 매개 처리도 일정한 크 
기의 작은 고정크기덩어리로 나눈다고 가정한다. 그러면 프로그람의 덩어리는 페지라 
고 하는데 프레임 또는 페지프레임이라고 하는 기억기의 작은 덩어리에 할당될수 있다. 
그러면 그 처리에서의 기억기조각은 마지막페지에만 생긴다. 

그림 7-16 은 페지와 프레임의 실례 

를 보여 준다. 어떤 주어 진 시점에서 자유■프레임목록 자유프레임목록 

기억기의 일부 프레임들은 쓰이고 일부 13 20 

는 자유상태 에 있 게 된다. 자유상태프 
레임 들에 대 한 표가 조작체 계 에 의해 
유지된다. 디스크에 기억된 처리 A 는 
4 개 폐지로 이루어 져 있다. 이 처리를 
넣 기 할 때 가 되 면 조작체 계 는 4 개 의 빈 
프레 임 을 찾아서 처 리 A 의 4 개 페 지 를 
4 개 프레 임 에 적 재 한다. 이 실 례 에 서 처 
럼 처리를 받아 들일 빈프레임이 불충 
분하다고 가정하자. 조작체계 가 처 리 A 
의 적재를 그만둘것인가? 그것은 아니 
다. 왜냐하면 론리주소라는 개념을 다 
시 쓸수 있기때문이다. 간단한 기준주 
소는 전혀 만족하지 않는다. 조작체계 
는 매 개 처 리 들에 대 해 페지 표를 검 사 
한다. 페지 표는 처 리 들의 매 개 페 지 에 
대 한 프레 임위 치를 보여 준다. 프로그 
람안에 서 매 개 론리 주소는 페 지 번 호와 
그 폐지 안에서의 상대주소로 이루어 져 
있다. 간단한 구획분할인 경우 론리주 그림 7-16. 자유프레임들의 배치: 기-전, L - 후 
소는 프로그람의 시작으로부터의 상대 

위치인데 처리장치는 그것을 물리주소로 변환한다. 폐지화에서 론리-물리주소변환은 
여전히 처리장치가 장치적으로 수행한다. 처리장치는 현재처리의 페지표를 어떻게 접 
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근해야 하는가를 알고 있어야 한다. 론리주소(페지번호，상대주소)를 가지고 처리장치 
는 물리주소(프레임번호，상대주소)를 내기 위해 페지표를 사용한다. 그 실례는 그림 
7-17 이 다. 

그 문제 를 해 결 하는 방법 은 이 미 나왔다. 주기억 기 는 많은 같은 크기 의 작은 프레 
임로 나누어 진다. 매개 프로쎄스들은 프레 임크기의 페지들로 나누어 진다. 작은 처 리 
는 적은 폐지를 요구하고 큰 처리는 많이 요구한다. 어떤 처리가 들어 오면 그의 폐지 
들은 가능한 프레임들에 넣기되고 페지표가 설정된다. 

4. 가상기억기 
요구페 지화 

페지화를 사용하면 다중사용자체계에 실지로 효과적이다. 더우기 프로쎄스를 페지로 
갈라 놓는 간단한 전략으로부터 또 다른 중요한 개념 즉 가상기억기가 발전하게 되였다. 

가상기억기를 리해하려면 이미 론의한 페지화개념을 재정의해야 한다. 그 재정의는 
요구폐지 화이 다. 어떤 처 리의 매 개 페 지 는 그것 이 필요하여 야 기 억 기 에 들어 온다는것 이 
다(즉 요구). 

긴 프로그람과 많은 수의 자료로 이루어 지는 큰 처리를 고찰하자. 짧은시간주기동 
안에 집행은 프로그람의 작은 부분(보조루린)에서 진행되며 자료가 한두개만 사용될것 
이다. 이것이 부록 4 에서 소개한 국부성의 원리이다. 프로그람이 일시 중지되기전에 
몇 개 페 지 만이 리 용되 고 있는 프로쎄 스에 대 하여 그의 모든 페 지 들을 주기억 기 에 넣 는 
것은 명백히 랑비로 된다. 우리는 몇개의 폐지만을 넣기함으로써 기억기를 더 효과적 
으로 리용할수 있다. 만일 프로그람이 주기억 기 에 없는 폐지의 명 령 으로 분기되거 나 
프로그람이 기억기에 없는 폐지의 자료를 참조한다면 페지오유가 일어 난다. 그래서 
조작체계 가 필요한 페지를 들여 오게 한다. 

따라서 임의의 시 점 에서 주어 진 처 리의 일부 폐지 가 기 억기 에 존재하므로 더 많은 
프로쎄스들이 기억기에 있을수 있다. 그러나 리용하지 않은 폐지를 내보내고 들여 오 
는데 시 간이 걸린다. 조작체계는 이 방법을 어떻 게 관리하는가를 잘 알아야 한다. 조 
작체계가 한개 페지를 들여 올 때 다른 페지를 내보내야 한다. 만일 직전에 사용된 페 
지를 내보내면 그 페지를 인차 다시 씨야 할 때가 있을것이다. 이런것은 많은 경우 과 
도교체 라고 하는 상태를 초래한다. 처 리 장치는 명 령집 행보다 페지교환에 더 많은 시 간 
을 쓸것이다. 이 과도교체의 해결을 1970 년대에 많이 연구했으며 여러가지 복잡하면서 
도 효과적인 알고리듬을 내놓았다. 명백히 조작체계는 최근경력에 기초하여 최근에 사 
용한 페지를 놔두게 한다. 

요구페지화로 하여 전체 페지를 주기억기에 넣어야 할 필요가 없다. 이 사실은 현 
저한 차이 를 가져 왔다. 프로쎄 스가 주기억 기 보다 더 콜 가능성 이 있 다. 프로그람작성 
에서 가장 기본적인 결함의 하나가 제기된다. 요구페지법이 없이 프로그람작성자는 어 
느만한 기 억기가 사용가능한가를 정확히 알아야 한다. 요구페지화로 하여 그런 일감이 
조작체계 와 장치 에 넘겨 진다. 프로그람작성 자와는 관계 없이 사람들은 디스크 기 억기 와 
갈은 크기 로 기 억기를 끝없이 취급한다. 

처리가 주기억기에서만 집행되므로 그 기억기는 실지기억기로 취급된다. 그러나 프 
로그람작성 자와 사용자는 다르게 할당된 매우 큰 기 억기를 느낀다. 후자는 따라서 가 
상기억기 로 취급된다. 가상기 억기는 다중프로그람작성 자에게 매우 효과적 이며 주기억 
기의 제 한을 느끼지 않게 한다. 
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페 지표구조 

기억기에서 단어를 읽어 내는 기본적인 기구는 페지번호와 편위로 이루어 진 가상 
주소 혹은 론리주소를 페지표를 리용하여 얻은 프레임번호와 편위로 이루어 진 물리주 
소로 변환하는 기능을 가진다. 페지표가 처리의 크기와 관련되는 가변길이이므로 그것 
을 등록기에 들수 없다. 대신 그것은 접근할수 있는 주기억기에 있어야 한다. 그림 
7-17 에서는 이 방식의 장치적실현을 보여 주었다. 어떤 특별한 처리가 집행될 때 어떤 
등록기 가 그 처 리의 페지 표시 작주소를 가리킨다. 가상주소의 페지 번호를 그 폐지 의 첨 
수로 사용하고 대응한 프레 임번호로 취급한다. 이것은 필요한 실주소를 만들기 위하여 
가상주소의 편위부분과 결합된다. 


주기 억 기 



대부분 체계에는 처리당 한개 페지표가 있다. 그러나 매 처리는 커다란 크기의 가 
상기억을 처 리한다. 실례 로 VAX 구성 방식 에서 매 개 처 리는 2 31 =2 GB 의 가상기 억기를 
가질수 있다. 2 9 =512 byte 폐지를 사용하면 매 처리 당 222 개의 페지표항목이 요구된다. 
명백히 페지표에 쓰인 기억기는 무시할수 없을 만큼 크다. 이 문제를 해결하기 위해 
모든 가상기 억토막들은 페지 표를 실기억기 가 아니 라 가상기 억기 에 보관한다. 이 것은 
페지표가 다른 페지들처럼 페지화의 대상이라는것을 의미한다. 어떤 처리가 집행중에 
있을 때 에는 적 어도 그 페지 표의 한 부분이 주기억기 에 있어 야 한다. 주기억기 에는 현 
재집 행 폐 지 의 페 지 표기 입 이 포함된 다. 일 부 처 리 장치 들은 큰 페 지 표를 조직 하기 위해 
2 준위방식을 사용한다. 이 방식에는 매개 기입이 하나의 페지표를 가리키는 폐지등록 
부가 있다. 따라서 등록부의 길이가 X 이고 페지표의 최대길이가 Y 이면 처리는 XX Y 
개의 페지로 이루어 질수 있다. 일반적으로 페지표의 최대길이는 한폐지로 제한된다. 
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이 장의 뒤에서 Pentium II 를 고찰할 때 이 2준위방법을 고찰한다. 

1 혹은 2 준위페지 표를 리용하는 다른 한가지 방법은 반전페지표구조를 리용하는것 
이 다(그림 7-18). 이 방법 은 IBM 의 AS /400 과 PowerPC 를 포함한 모든 IBM 의 RISC 
제품들에서 사용된다. 


가상주소 



그림 7-18. 변환페지표의 구조 


이 방법 에 서 가상주소의 패 지 번호부분은 간단한 하쉬함수 1 을 리 용하여 하쉬표에 배 
치 된다. 하쉬 표는 페 지 표항목을 포함한 반전폐지 표에 대 한 지시 기 를 가진다. 이 구조 
에서는 가상페지 당 하나의 항목을 포함하기보다는 하쉬표와 매 개 실기억기폐지 에 대 한 
반전페지표에 하나의 항목이 존재한다. 따라서 실지기억기의 고정된 부분이 처리나 가 
상폐지들의 수를 고려함이 없이 표에 요구된다. 하나이상의 가상주소가 같은 표항목에 
배치되므로 자리넘침을 관리하는데 련쇄기술을 리용한다. 이 하쉬기술은 전형적으로 
하나 아니 면 2개 항목으로 된 짧은 련쇄 로 실현한다. 

5. 변환엿보기완충기 

원리적으로 모든 가상기억참조는 두번의 물리적기억기접근을 하게 하는데 하나는 
근사한 페지표항목을 꺼내고 다른 하나는 펼요한 자료를 꺼내는것이다. 따라서 정확한 
가상기억방식은 2 배의 기억접근시간을 가진다. 이 문제를 해결하기 위해 많은 가상기 
억 방식 들은 TLB 라고 하는 페 지 표항목들을 위한 특수고속완충기 를 사용한다. 이 완충 


1 하쉬 함수는 0부터 M 까지의 수들을 0부터 N 외 수에로 넘긴다. 여 기서 M>N 이 다. 하쉬 함수의 출력은 하쉬표에 
색인으로서 리용된다. 하나이상의 입력이 같은 출력에 넘겨짐으로 하나의 출력항목에 관하여 하쉬표입구점 즉 이 
미 차지되여 있는 하쉬표입구점에로 넘길수 있다. 그 경우에 새로운 항목은 다른 하쉬표배치에로 넘어 가야 한다. 
일반적으로 새로운 항목은 첫 련속적인 빈공간에 위치하며 본래의 배치의 지적자는 입구점들을 서로 련결시켜 준 
다(하쉬표에 대한 보다 자세한 론의를 위해서는 [STAL98] 을 볼것). 
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TLB 사용의 흐름도를 보여 준다. - 
용된 폐지의 위치로 된다. 그러므로 
i 함하게 된다. VAXTLB 에 대한 연 
보여 준다 [ CLAR 85， SATY 81]. 
자구는 이 고속완충기체계와 호상작사 
가상주소는 일반적으로 폐지번호와 


폐지에 대한 프로그람접근요구 





억기체계는 같은 페지표항목이 있는가를 보기 위하여 TLB 를 참조한다. 만일 있다면 
실지 (물리)주소는 프레 임번호와 편위를 결합하여 엄 어 진다. 만일 없으면 항목이 페지 
표로부터 접근된다. 일 단 표식자와 나머지부분으로 형성 되는 실주소가 얻 어 지 면(그림 
4-17 참고) 캐 쉬 는 단어 가 존재 하는 블로크가 존재 하는가를 찾아 본다. 만일 있 다면 처 
리 장치 로 되돌아 간다. 그렇지 않다면 주기억기 로부터 단어 를 캐쉬 에 받아 들인다. 

독자들은 단일 기 억 기참조를 진행하는 처 리 장치하드웨 어 의 복잡성 을 충분히 평 가할 
수 있다. 가상주소는 실주소로 변환된다. 이것은 TLB 나 주기억기，디스크에 있는 페 
지 표에 대 한 참조를 진행한다. 후자의 경우에 단어를 포함하는 페지는 주기억기 에 넣 
어 져야 하며 이 페지의 블로크는 캐쉬에 넣어 진다. 추가적으로 이 폐지에 대한 페지 
표항목은 갱 신되 여 야 한다. 


TLB 조작 케쉬조작 



6. 토막화 

주소가능한 기억기를 세분화할수 있는 또 다른 방법에는 토막화가 있다. 페지화는 
프로그람작성자에게 보이지 않으며 프로그람작성자에게 더 큰 주소공간을 제공할 목적 
으로 봉사한다면 토막화는 프로그람작성 자에게 보이 며 프로그람과 자료구성 의 편리성 , 
명 령파 자료에 대 한 특권파 보호속성들을 결합시키는 수단들을 제공한다. 

토막화는 프로그람작성자에게 기억기가 여러개의 주소공간이나 토막으로 이루어 진 
것처럼 보이게 한다. 토막은 가변이며 실지로 동적크기이다. 일반적으로 프로그람작성 
자나 조작체계는 프로그람과 자료를 서로 다른 토막들에 할당한다. 여러가지 형태의 
프로그람에 많은 프로그람토막과 자료토막이 있을수 있다. 매개 토막은 접근권한을 부 
여 받는다. 기억기참조는 주소형식 (토막번호, 편위)으로 이루어 진다. 

이 구성은 프로그람작성 자들에게 비토막화주소공간에 비 하여 많은 우점을 제공해 
준다. 

• 자료구조의 확장에 대한 조종이 간단하다. 프로그람작성자가 개별적인 자료구조 
가 얼마나 크게 형성될것인가를 미리 알지 못한다면 그것을 추측할 필요가 없다. 
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그것은 늘어 나는 자료구조취급을 간단하게 한다. 자료구조는 자기의 토막에 할 
당될수 있으며 조작체계는 토막을 필요에 따라 확장，축소시킨다. 

• 이 구성은 전체 프로그람묶음이 재련결되고 재넣기되는것을 요구함이 없이 프로 
그람들이 독자적으로 변경되고 재를파일되게 한다. 또한 여러가지 토막들의 리 
용을 이룩할수 있 다. 

• 이 구성자체가 프로쎄스들속에서 공유되게 한다. 프로그람작성자는 편의프로그 
탐이나 다른 프로쎄스들에 의하여 주소화될수 있는 토막내에 유효한 자료표를 
배치 할수 있 다. 

• 보호에 적합하다. 토막이 프로그람들이나 자료의 잘 정의된 묶음을 포함하도록 
구축될수 있으므로 프로그람작성 자나 체계관리 자가 편리 한 형태로 접근특권을 
할당할수 있다. 

이 우점들은 프로그람작성자에 의해서 볼수 없는 폐지화에서는 리용할수 없다. 다 
른 한편으로 페지는 기억기관리의 효률적인 형태를 제공한다는것을 알수 있다. 두 우 
점 들을 결 합하기 위 하여 일 부 체 계 들은 페 지 화나 토막화를 제 공하는 하드웨 어 와 조작 
체 계 쏘프트웨 어 를 장비 한다. 

제 4 절. Pentium n 와 PowerPC 의 기억기관리 
1. Pentium 11 의 기억기관리장치 

32 bit 구성 방식으로 소개된 극소형처 리장치들은 중규모，대규모체계들에서 배운 절 
들에서 취급된 기억기관리 방법들을 전개하고 있다. 많은 경우 극소형처리장치는 이전 
의 대형체계 에 비해 우월하다. 그 방식들은 극소형처 리장치하드웨 어판매 자들에 의 하여 
발전되며 여 러가지 조작체계들에 제공되기때문에 아주 일반적 인 추세로 되고 있다. 
PENTIUM II 에서 사용되는 방식 이 대표적 인 실례 이 다. PENTIUM II 의 기 억관리 장치 
는 본질적 으로인텔의 80386과 80486 처 리 장치 에서 사용한것과 같다. 

주소공간 

PENTIUM II 는 토막화와 페 지 화를 위한 하드웨 어 를 다 포함하고 있 다. 사용자가 
다음의 기 억 기 에 대 한 4 가지 독특한 고찰로부터 의 선택 을 허 용하면 두 기 구는 리용되 
지 않을수 있다. 

• 비토막화비페지화기억기: 이 경우 가상주소는 물리주소와 갈다. 실례로 이것은 
복잡하지 않고 높은 성능을 가진 조종기응용프로그람인 경우에 유효하다. 

• 비토막화페지화기 억기 : 여 기서 기 억기는 페지화된 선형주소공간으로 보인다. 기 
억기의 보호와 관리 자페지 화를 통해 수행된다. 이 것은 일부 조작체 계 에 의해 실 
현된다 (실례 로 Berkeley UNIX ). 

• 토막화비페지화기억기: 여기서 기억기는 론리주소공간들의 집합으로 보인다. 페 
지화에 비 한 우점은 필요하다면 단일바이트준위아래 에서의 보호를 가져 온다는것 
이다. 더우기 페지화와는 달리 토막이 기억기에 있을 때 필요한 변환표가 소편에 
있는것 을 담보한다. 따라서 토막화비 페 지 화기 억 기 는 접 근시 간을 예 견할수 있 다. 
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• 토막화페지화기 억기 :토막화는 접근조종의 대상인 론리기 억기구획을 정의하는데 
사용되 고 페 지 화는 구획안에서의 기 억기할당을 관리하는데 사용된다. UNIX 와 같 
은 조작체계가 이렇게 보인다. 


3 

h 

A nj 

첨수 

T 

I 

rpl | ! 


T I - 지적자 R P L - 요구특권준위 



Al ᅭ 24 / ^0^9 lfi / s /4 13 llA\ 8 

oyj 

기 준주소 a ...24 c 

,/\\y 

bI II 

토막한계 I 
19... 16 

? DPL 5 

i 형래 

기 준주소 23 … ]fi ■ 

기준주소 15... 0 

토막한계 ] 5... 0 ,■ 


AVL = 체계프로그람에 의한 리용허가 G= 립자설정 ■= 예약 

D/ B = 조작크기 암시 비 트 P = 토막존재 

DPL= 서술자특권준위 S= 서술자형래 





US = 사용자/ 체계관리자 PCD = 캐 쉬 리 용불가능 A= 접근비트 

RW = 읽기/쓰기 



그림 7-2L. Petium II 기 억 기 관리 형 식 들 
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T— 토막선택부， L 一선형주소， t 一 토막서술자, H- 폐지목록항목， n- 폐지표항목 


































토막화 

토막화가 사용되 면 매 개 가상주소 (PENTIUM II 문서 에서는 론리주소라고 한다.)는 
16 bit 토막참조와 32 bit 편위 로 이 루어 진다. 토막참조의 2 bit 가 보호기 구에 서 취 급되 여 
14 bit 가 토막정의에 사용된다. 따라서 비토막화된 기억기에서 사용하는 가상기억기는 
2 32 =4 GB 이 다. 토막화기 억 기 에서 총 가상기 억 공간은 2 46 =64 TB 로 보인다. 물리주소공간 
은 32 bit 주소로서 최 대 4 GB 의 공간을 가리킨다. 

총 가상기억공간은 실지 64 TB 보다 더 크다. 이것은 처리장치의 가상주소변환이 
어느 처리가 현재 능동인가에 따르기때문이다. 가상주소공간은 2 개 부분으로 나누어 
진다. 가상주소공간 (8 K 토막 X 4 GB ) 의 절반은 모든 처리가 공유한 전역부분이고 나머 
지 는 국부이 며 매 처 리 에서 구별된다. 

매개 토막에 관련된것이 두가지 형태의 보호인데 그것은 특권준위와 접근속성이다. 
최대보호 (0 준위)에서 최소보호 (3 준위)애까지 4 가지 특권준위가 있다. 자료토막과 관 
련된 특권준위는 그의 《등급》이며 프로그람토막에 할당된 특권준위는 그의 《허가성》 
이 다. 집 행프로그람은 그의 허 가성 준위 가 그 자료토막의 특권준위 보다 작거 나(높은 특 
권) 갈은(갈은 특권) 자료토막만을 접근한다. 

장치는 이 특권준위 가 어 떻게 리용되는가를 지 령하지 않는다. 이 것은 조작체 계의 
설계 와 실현에 관계된다. 특권준위 1은 대부분 조작체계 에 사용되 고 특권준위 0 은 기억 
기 관리보호와 접 근조종에 종사하는 조작체 계의 작은 부분들에 사용된다. 응용프로그람 
에는 2 개 준위가 부여된다. 많은 체계들에서 응용프로그람은 준위 3 에 놓이며 준위 2 
는 사용하지 않는다. 자기 자체 의 보호기구들의 실 현 으로 특수응용프로그람보조체 계 는 
준위 2 의 대 리 자로 된다. 그의 실례 로서는 자료기지관리체계，사무자동체 계，쏘프트웨 
어 기 술환경 들이 다. 

자료토막접 근외 에 특권기 구는 일정한 명 령의 사용을 제 한한다. 기 억관리등록기 를 
취급하는것 갈은 일부 명령들은 오직 준위 6 에서만 집행할수 있다. I 八) 명령은 오직 조 
작체 계 에 의 해 승인된 일정 한 준위 즉 일 반적 으로는 1 준위 에 서 만 집 행 될수 있 다. 

자료토막의 접근속성은 읽기-쓰기 또는 읽기만 승인하는가를 가리킨다. 프로그람 
토막에 서 의 접 근속성 이 읽 기 -수행 또는 읽 기 전용접 근을 지 적한다. 

토막화에 서의 주소변환기 는 가상주소를 선형주소로 취 급되 도록 바꾸는것 을 포함한 
다(그림 7-21 L ). 가상주소는 32 bit 편위와 16 bit 토막선택부로 이루어 진다(그림 7-21 
1). 토막선택부는 다음의 마당들로 이루어 진다. 

• 표지 시 자 ( TI ): 동토막 또는 국부토막표를 변환에 쓰는가를 가리킨다. 

• 토막번호: 막의 번호.이것은 토막표에서의 첨수이다. 

• 요구특권준위 ( RPL ) : 접 근에 요구되 는 특권준위 

토막표에서 매개 항목은 64 bit 로 이루어 져 있다(그림 7-21 n ). 그의 마당들은 
표 7-5 에 정 의한다. 

페지화 

토막화는 선택항목이며 불가능할수도 있다. 토막화가 사용될 때 프로그람에서 사 
용되는 주소는 가상주소이며 이미 설명한대로 선형주소로 변환된다. 토막화를 쓰지 않 
을 때 선형주소가 프로그람에서 보인다. 다른 경우 선형주소를 실지 32 bit 주소로 변환 
할 때는 다음단계가 리용된다. 

선형주소의 구조를 리해하려면 PI 페지화기구가 실지로 그 준위와 조사동작을 한다 
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® 선형 주소공간을 1024 개 폐 지 무리 로 분리 시 키 는데 한: 
표는 1024 개 항목으로 이루어 지며 매개 항목은 4 kB - 
는 모든 처 리 에 한개 페 지 등록부를 또는 매 처 리 에 한: 
결 합의 사용에 대 하여 선택한다. 현재 과제 의 페 지 등격 
지표는 가상기 억기에 있을수 있다. 

표 7-5. Pentium II 기 억 기 관러 파라메 터 


기 준 

4-Gbit 선형 주소공간안에 


토막서 술자(토막표항목) 

있는 토막시작주소를 정의 한다. 


D/B bit 


코드토막에 서 이것은 D 비 트이며 연산수들과 주소화방식 들이 1 

서술자록권준위 (DPL) 

토막서 술자에 대 웅하는 토막특권준위 을 구별 한다. 

립도비트 (G) 

한계마당이 한바이트 혹은 4kbyte 의 단위로 해석되는가를 ^ 

한계 

토막의 크기 를 정 의 한다. 처 리 장치 는 립 i 비 트에 따라 lbyte . 
혹은 4Kbyte 로부터 4Gbyte 의 토막크기 한계 까지 두개 의 방식 - 

Sbit 

주어 진 토막이 체계토막 혹은 코드 및 자료토막인가를 결정 

토막존재 비트 (P) 

무폐지화된 체계를 사용한다. 그것은 토막이 추기억기 에 존 
계들에서 이것은 늘 1로 설정한다. 

형 

각이한 종류의 토막들사이에서 구별하며 접근속성을 지적한^ 

폐 지등록항목과 페 지 표항목 

접근비트 ⑷ 

이 비트는 대웅하는 페지에 대한 읽기 혹은 쓰기조작이 일어 
장치에 의하여 1로 설정한다. 

(D) 

이것은 대웅하는 폐지에서 쓰기조작이 일어 날 때 1 로 설정， 

폐지프레임주소 

존재비 트가 1 인 경우 기 억기 에 폐지 의 물리주소를 제 공한다. 
여 아래 12bit 는 0으로, 웃 20bit 만은 항목에 포함된 다. 

폐지 캐쉬 불가능비 트 (PCD) 

페 지 로부터 자료가 캐 쉬 라는것 을 지 적한다. 

페 지 크기 비 트 (PS) 

폐 지 크기 가 4Kbyte 혹은 4Mbyte 라는것 을 지 적 한다. 

폐 지 쓰기 동시 비 트 (PWT) 


쓰기-동시 혹은 쓰기-비동시캐쉬화방책이 대웅폐지에서 자료가 

존재 비트 (P) 

페지표 혹은 폐지 가 주기억기 에 있다는것을 지적한다. 

읽 기 -쓰기 비 트 (RW) 

사용자-준위페지에서 페지가 사용자-준위프로그람인 경우 5 
;절 근 (y -，= 一，ᅬ ᅱ - 1 


인가를 지 적한다. 
사용자/체 계 관리 자비 트 (US) 

폐 지 가 조작체 계 에 11 - 1 ᄍ 


4 지적한 4. 




그림 7-21 은 페지등록부와 페지표의 양식을 보여 주고 그 마당들은 표 7-5 에 정의 
한다. 접근조종기구는 폐지 또는 무리기준에 제공된다. 

Pentium II 는 또한 변환참조완충기를 사용한다. 완충기는 32개 페지표항목을 기 억 
한다. 페지등록기가 변할 때마다 완충기가 지워 진다. 

그림 7-22 는 토막화, 폐지화기구의 결합을 보여 준다. 명백히 변환참조완충기와 
기억기고속완충기는 보이지 않는다. 



끝으로 Pentium II 는 80386 이나 80486 에는 없는 새로운 확장으로서 2 개 패지를 
포함한다. 만일 조종등록기 4 의 PSE (페지크기확장)비트가 1 이면 페지화단위 가 조작체 
계작성 자로 하여 금 페 지 를 4 KB 나 4 MB 크기 로 정 의 하게 한다. 

4 MB 페지가 사용될 때 페지의 표참조가 한 준위로만 진행된다. 장치가 페지등록부 
를 접 근할 때 페 지 등록부항목(그림 7-21 e ) 은 PSbit 를 1 로 설정 한다. 이 경우 비트 
9〜21 은 무시되고 비트 22〜31 이 기억기의 4 MB 폐지의 기준주소를 정의한다. 따라서 
한개 페지표만이 있다. 

4 MB 폐지를 사용하면 큰 주기 억기 에 대하여 기 억관리등록기요구를 감소시 킬수 있 
다. 4 KB 페 지 주소에 대 하여 총 4 GB 주기억 기 는 페 지 표로서 4 MB 기 억 기 를 요구한다. 
4 MB 페지 에서는 4 KB 길이 이면 페지 기 억기를 관리하는데 충분하다. 

2. Power PC 기억기관리장치 

Power PC 는 광범한 주소화기 구를 제 공한다. 32 bit 구성 방식 의 실현을 위해 간단한 
토막화와 페지화기 구가 쓰인다. 64 bit 실현을 위 해서는 페지 화와 더 강력한 토막화기구 
가 지 원된다. 더 우기 32， 64 bit 처 리 장치에 는 블로크주소변환이 라는 장치 기 구가 있다. 
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페지화에서 수많은 페지들이 프로그람에 의해 자주 참조된다. 실례로 조작체계표나 화 
면을 완충기로 사용하는 프로그람은 이 동작을 제시한다. 결과는 자주 쓰이는 페지는 
계 속 페 지 화된 다는것 이 다. 블로크주소화는 처 리 장치 가 명 령 기 억 기 와 자료기 억 기 를 크 
게 4 개 블로크로 배 치하게 한다. 

블로크주소화는 다음장에 서 서 술한다. 32bitPowerPC 의 페 지 화，토막화기 구에 대 해 
서 만 본다. 64 bit 방식 은 류사한다. 

32 bit PowerPC 는 32 bit 유효주소를 사용한다(그림 7-23 1). 주소는 12 bit 의 바 
이트선택부와 16 bit 페지지적자를 포함한다. 따라서 2 12 =4kbyte 폐지가 사용된다. 한 토 
막당 2 16 =6K 페 지 이 상이 사용된다. 주소의 4 개 비 트는 16 토막등록기 의 하나를 가리 키 는 
데 쓰인다. 이 등록기들의 내용은 조작체 계 가 조종한다. 매 개 토막등록기는 조종 bit 와 



AP I- 생 략된 폐 지 첨 수 WI NG - 캐 쉬 와 기 억 기 접 근비 트 

PP - 페지보호비트 


P - 

/lo 

I 혜지 1 1 

바이트편위 1 


그림 7-23. PowerPC 32bit 기억기관리형식 
1- 유효주소， L- 페지표항목， n- 실주소 


24bit 지 적 자를 가지 며 그리하여 32bit 유효주소는 52 bit 가상주소로 넘 어 간다(그림 
7-24). 

PowerPC 는 하나의 페지표를 사용한다. 가상주소는 다음과 같은 방법 으로 페지 표 
에 대한 첨수를 사용한다. 먼저 하쉬코드가 다음과 같이 계산된다. 

H(0... 18) =SID(5...23) © VPN(0... 18) 
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다음 비 트별 배 타론리 합으로 가상토막正) 의 오른쪽 19 bit 를 계 신 
형 성한다. 표는 8 개 항목의 n 개 무리 로 조직 된 다. 하쉬 코드(페 
는)에서 10〜 19 bit 는 표에서 무리중 하나를 선택하는데 사용된다. 
상주소와 같은가를 조사하기 위해 항목무리 를 조사한다. 

그러 기 위 하여 매 개 페 지 표항목은 가상토막 正) 와 비 교적 짧- 
기 번호의 왼쪽 6 bit 를 포함한다(왜 냐하면 16 bit 가상폐지번호의 1 
룹을 선택하는 하쉬 함수에 참가하며 가상페지 번호의 단축형 만이 






20 bit 가 유효주소의 아래 12 bit 와 결 합되 여 32 bit 물리 주소를 형 성한다. 

같은것이 없으면 하쉬코드는 표의 반대쪽 끝에서 같은 위치에 있는 새 페지표참조 
를 만들기 위하여 완성 된 다. 다음 이 그룹은 적 합한 상대 에 의하여 조사된 다. 같은것 
이 없으면 페지오유새치기가 일어 난다. 

그림 7-24 는 주소변환기 구의 론리 를 보여 주며 그림 7-23 은 유효주소，페 지 표항목， 
실 주소의 양식 을 보여 준다. 끝으로 표 7-6 은 페 지 표항목에 서 의 변수들을 정 의한다. 

64 bit 기 억 기관리 방식은 32 bit 실현을 개선하도록 설계되 였다. 본질적 으로 모든 유효 
주소，일 반등록기 , 분기 주소등록기 들은 64 bit 크기 로 왼쪽으로 확장된 다. 


표 7-6. PowerPC 기 억기관리파라메터 


토막표기 입 

유효비트 (ID) 

64G 유효토막중 한개를 지적한다. 토막표에로의 기 입을 결정하는데 리용한^ . 

기입 유효비트( V ) 

이것 이 기 억기 혹은 I/O 토막이라는것 을 지 적한다. 

토막종류비트 (T) 

이것 이 기 억기 혹은 I/O 토막이라는것을 지적한다 

체 계관리 자 열 쇠 ( K S ) 

페지표에로의 기입을 결정 하는데 가상페지 번호를 사용한다. 

페 지 표기 입 

기입 유효비트( V ) 

기 입 에 유효자료가 있 다는것 을 지 적 한다. 

하쉬 기 능식 별 자 (H) 

이 것 이 1 차 혹은 2 차하쉬기 입 이 라는것을 지 적 한다. 

간략화된 폐지색인 (API) 

가상주소를 동일하게 하는데 리용된다. 

참조비트 ( R ) 

이것은 대웅하는 폐지 에 대 한 읽기, 쓰기조작이 일어 날 때 처 려장치 에 의 si 1 로 설 
정된 다. 

변환비트 ( C ) 

이것_은 대웅하는 페지에 대한 쓰기조작이 일어 날 때 처려장치에 의해 1 로 1정된다. 

WEMG 비트들 

W =0; 동시 쓰기방책 사용， W = l ; 비 동시 쓰기방책 사용 
1=0; 비금지고속완충화，1=1; 금지고속완충화. 

M =0; 비공유기억기， M = l ; 공유기억기 . 

G =0; Hi ^ ^^1 ^1 ^ 71 . 

폐 지 보호비 트들 (PP) 

접근권을 정의 하는데 토막등록기 혹은 토막표항목으로부터 K 비트들을 리용 t 접근조 
종비트_ 


230 




참고문헌과 Web 싸이트 

[ STAL 98] 은 이 장의 문제 점 들을 자세 히 설 명한다. 


STAL98 Stalling, W. Operating System, Internals and Design Principles, 3rd Edition 
Upper Saddle River, NJ: Prentice Hall, 1998 



Web 싸이 트 

• Open Group Research Institute-Operating System Program : 

◦S 분야의 넓은 범위 에서 R&D 를 관리하는 공개그룹(공개쏘프 
트웨 어 지 반과 X 八 ) pen 회 사의 련 합) 


• ACM Special Interest Group on Operating System ： 

SIGOPS 출판물과 협 회 들의 정 보 


련습문제 

1. 매개 일감이 같은 특성을 가지는 다중프로그람콤퓨터를 가지고 있다고 가정하자. 
한 일감에 대한 하나의 계산주기 구 에서 절반시간은 입출력에 돌려 지고 다른 절 
반은 처리장치동작에 쓴다. 매 일감은 총 N 개 주기에 집행된다. 단순회전순위 
우선권 이 사용되 며 입 출력 동작이 처 리 장치연산과 겹칠 수 있 다고 가정 하고 다음 
지 표를 정 의하시 오. 

• 주기 시 간=한 일감을 완성하는데 드는 실지 시 간 

• 처 리 능력= 주기 T 시 간당 완료되 는 평 균일감수 

• 처 리 장치 리 용률=처 리 장치 가 동작(대 기 아님 ) 중인 시 간의 백 분률 

이 지표들을 1,2,4 개 일감에 대해 주기 T 가 다음과 같이 분할된다고 가정하고 
계산하시오. 

1) 입출력은 첫 절반，처 리 장치는 두번째 절반 

L ) 입 출력 은 첫 번째 와4번째의 1/4주기，처 리 장치 는 2번째 와 3번째의 1/4주기 

2. 혼자 집행된다면 한개의 입출력묶음프로그람이 처리장치를 사용한다. 입출력대 
기 시 간이 보다 더 길것 이 다. 처 리 장치 묶음프로그람은 반대 이 다. 짧은시 간일 정 작 
성알고리듬이 이미 지 나온데서 처 리장치시간을 조금 사용한 프로그람을 먼저 출 
구한다. 이 알고리 듬이 입출력 묶음프로그람을 먼저 집 행시키는가를 설명 하시 오. 

3. 값이 100인 A 의 100개 렬의 합을 계산하는 식 

j = l 
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을 계 산하는 프로그람이 있 다. 페 지 크기 가 1000 단어 일 때 요구페 지 법 가 발생하 
며 자료에 할당된 주거 억기의 수가 5개 페지 프레 임 이 라고 가정 하자 . A 가 가상기 
억기에 행 또는 렬로 기억될 때 페지오유속도에서 차이가 있는가를 설명하시오. 

처리장치에서 현재 집행되는 처리의 페지표가 다음과 같다고 가정하자. 모든 수 
자는 16 진수이고 모든 수는 0 에서 시 작되며 모든 주소는 기 억기바이트주소들이 
다. 페 지 크기 는 1024 B 이 다. 

1) 일반적으로 CPU 에서 발생된 가상주소가 물리주기억주소로 어떻게 변환되는 
가를 정확히 설명하시오. 

L ) 어느 물리주소가 다음가상주소에 해당되는가? 

(1) 1052 

(2) 2221 
藥) 5499 


가상폐지 

번호 

유효비트 

참조비트 

변경 비트 

폐지프레임번 

호 

0 

1 

1 

0 

4 

1 

1 

1 

1 

7 

2 

0 

0 

0 

- 

3 

1 

0 

0 

2 

4 

0 

0 

0 

- 

5 

1 

0 

1 

0 


가상기억기체계에서 폐지크기가 너무 작지도 않고 너무 크지도 않은 리유는 무엇 
인가. 

다음의 가상폐지번호렬은 가상기 억기 에서 콤퓨터 의 집 행과정 에 부닥친다. 
342647132635123 

최 근에 쓰인 폐지를 내 보내 는 방법을 쓴다고 가정 하자. 인 주기억페지 

용량 n 의 함수로써 폐지명중률(주기억 기 에 있는 페지 에 대 한 참조률)을 그라프 
로 그리 시 오. 주기억 기 는 초기 에 비 였 다고 가정한다. 

VAX 콤퓨터 에 서 사용자페 지 표는 체 계 공간의 가상주소에 위 치 한다. 주기억 기 보다 
가상공간에 사용자페지표를 배치하는것이 어떻게 좋은가? 불리한 점은 무엇인가? 
콤퓨터체계가 토막화, 페지화를 가지고 있다고 고찰하자. 토막이 기억기에 있을 




때 마지 막페 지 에 일 부 단어조각이 생 긴 다. 그외 에 토막크기 S, 페 지크기 가 P 라면 
S/P 만한 페 지 표항목이 있다. 페 지크기 가 작을수록 토막의 마지 막폐 지 에서 조각 
은 작고 페지표는 크다. 종합적 인 최소페지크기는 얼마인가? 

9. 콤퓨터는 캐쉬，주기억기，가상기 억기로 쓰이는 디스크를 가진다. 참조된 단어 가 
캐 쉬 에 있 다면 그것 은 접 근하는데 20ns 가 필요하다. 주기억 에 있 으나 캐 쉬 가 없 
다면 그것은 캐쉬에 불러 들이는데 60ns 가 필요하며 참조가 다시 시작된다. 만 
일 주기억 기 에 없 다면 디 스크에 서 그 단어 를 주기억 기 에 가져 오는데 12 ms 가 걸 
리고 캐쉬에 넣는데 60ns 가 걸리며 참조가 계속된다. 캐쉬명중률은 0.9 이고 주 
기 억기 명중률은 0.6 이 다. 이 체 계 에서 참조단어 를 접 근하는데 필요한 평 균시간 
을 ns 로 계 산하시 오. 

10. 한개 과제가 4 개 같은 크기의 토막들로 분할되고 체계가 매개 토막에 8 개 페지 
서술자표항목을 만든다고 가정하자. 또한 체계는 토막화와 페지화를 결합하여 
사용한다. 페 지 크기 는 2KB 라고 가정 하자. 

1) 매개 토막의 최대크기는 얼마인가? 

1_ ) 과제 의 최대 론리 주소공간은 얼 마인가? 

n) 이 과제 가 물리위 치 00021ABC 위 치의 요소를 접근한다고 가정 하자. 과제는 
그를 위해 어떤 양식의 론리주소를 형성 하는가? 체 계의 최 대물리주소공간은 
얼마인가? 

원천 [ALEX93] 

11. 극소형처 리 장치의 물리 적주기억기접근공간이 2 32 B 라고 하자. 그러면 한개 론리 
토막주소공간은 최대 2 31 B 이 다. 매개 명 령은 2 개 부분으로 주소를 가진다. 외부 
기 억 관리 단위 (MMU) 가 쓰이 는데 그 관리 방식 은 토막에 고정 크기 2 22 B 의 물리 적 
기억기블로크를 할당한다. 토막의 물리적주소시작번호는 항상 1024 로 나뉘여 진 
다. MMU 가 어떻게 선택되는가를 설명하시오. 


원천 [ ALEX 93] 


12. 폐지화된 론리주소공간을 1 MB 물리 적기 억공간으로 넘 겼다고 고찰하자. 

1) 처 리 장치 의 론리주소는 어 떤 양식 인가? 

L ) 페지표의 길이와 폭은 얼마인가? 

n ) 물리적기억공간이 절반으로 줄 때 페지표에는 어떤 영향이 미치는가? 
원 천 [ALEX93] 
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제 3 편. 중앙처리장치 


제 3 편의 중심 

이 제 까지 는 CPU 를《 검 은통》으로 보고 CPU 와 입 출력장치 ( FO ), 기 억 기 등과의 호 
상작용을 고찰하였다. 이 편에서는 CPU 의 내부구조와 기능에 대 하여 고찰한다. CPU 는 
조종장치, 등록기，산수-론리 연산장치，명 령실행장치 로 구성되 여 있으며 이 러 한 구성요소 
들은 서로 결합되여 있다. 제 3편에서는 또한 명령모임설계와 자료형과 같은 구조적인 론 
의와 관흐름조종과 갈은 구성과 관련한 내용들을 고찰한다. 

제 3 편의 장별 내용 

제 8 장. 콤퓨터산수연산 

제8장에서는 먼저 산수一론리연산장치의 기능을 고찰하고 그다음 수의 표현와 산수연 
산의 실현기술을 기본으로 고찰한다. 처리장치들은 일반적으로 두가지 형의 연산 즉 옹 
근수 혹은 고점 수연산과 류점 수연산을 진행한다. 이 장에 서 는 이 두가지 연산에 대 하여 
우선 수의 표현을 보고 그다음 산수연산을 론의한다. 이 장에서는 국제전기전자기술자협 
회 ( IEEE ) 754에 서 표준화된 류점 수연산을 구체 적 으로 고찰한다. 

제 9 장. 명령모임: 특성과 기능 

명령모임설계와 관련한 복잡한 문제들은 제9장과 제10장에서 고찰한다. 제 9 장에서는 
명령모임설계의 기능적인 개념들을 기본으로 서술하고 있다. 이 장에서는 우선 콤퓨터명 
령 들로 규정 되 는 기 능형 태 들을 고찰하고 그다음에 연산에 참가하는 자료를 규정 하는 연 
산수형과 명 령모임들에서 일반적으로 찾아 보게 되는 연산종류를 고찰한다. 

제 10 장. 명령모임: 주소화방식과 형식 

제 9장에서는 명령모임의 의미를 기본으로 취급하였다면 제10장에서는 명령모임의 문 
법 을 기 본으로 고찰한다. 특히 제10장에서 는 기 억기주소의 규정방법과 콤퓨터 명 령의 총체 
적인 형식을 고찰한다. 

제 11 장. CPU 구조와 기능 

제 11 장에서는 CPU 의 내부기 억기 인 등록기의 리용에 대하여 서술하고 그다음에 
CPU 의 구조와 기 능고찰에 필요한 모든 자료들을 보게 된 다. 전체 구성 ( ALU , 조종장치， 
등록기파일)을 다시 론의하며 특별히 등록기파일의 구성 에 대 해서도 론의한다. 또한 기 
계명령실행에서 처리장치의 기능도 고찰한다. 명령주기는 꺼내기，간접，실행，새치기주 
기들의 기능과 호상련관성을 보여 주는 방법으로 고찰한다. 마지막으로 성능을 개선하기 
위한 관흐름의 리용에 대 해서 도 깊 이 있게 고찰한다. 

제12장 축소명령모임콤퓨터 

제 3 편ᅪ 나머지장들에서 는 CPU 설계 의 기 본경 향을 보다 상세 히 고찰한다. 제 12 장 
에서는 축소명령모임콤퓨터 ( RISC ) 의 구성과 관련한 방법들을 서술하고 RISC 설계를 리 
용해 야 할 필요성 들을 고찰한다. 그다음에 RISC 명 령모임설계 와 RISC CPU 구조를 보다 
상세히 고찰한다. 

제 13 장. 슈퍼스칼라처리장치 

이 장에서는 최근에 처리장치설계에서 많이 리용되는 슈퍼스칼라기술을 고찰한다. 
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제 8 장. 콤퓨터산수연산 


표시할수 있는 옹근수 


I 一一 I 一一 L 


- 2 al 0 

기-2으 I 보수 



부의 

자.리 넘침 


부의 tm ； 
자리넘침 


■ 아래 
»리 넘침 



- ( 1 - 2 생 4 ) x 2 128 -0.5X 2 신 27 0 0 . 5 x 2 신 27 ( 1 -2 생 4 ) x 2 128 

L - 류점수 


♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦ 

♦ 콤퓨터 산수연산에 서 가장 기 본적 인 두가지 문제 는 수를 표현하는 방법 (2 진수형 식 ) 
과 기본산수연산(더하기，덜기，곱하기，나누기)에 리용되는 알고리듬이다. 이 두 
가지는 옹근수와 류점수산수연산에 다같이 적용된다. 

♦ 류점 수는 어 떤 옹근수제곱 (지 수부) 으로 된 상수 (밑 수) 가 곱해 진 수 (소수부 혹은 
결수부)로 표현된다. 류점수는 매우 크거나 작은 수들을 표현하는데 리용할수 있다. 

♦ 대 다수 처 리 장치 들은 IEEE 754 에 서 류점 수표현 및 산수연산을 위 한 표준화된 권고 
안에 기 초하여 실현한다. IEEE 754는 32및 64 bit 형 식의 류점수표현와 그 연산을 규 
정하고 있다. 

♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦솔 

이 장에 서 는 먼저 산수-론리 연산장치 ( ALU ) 에 대 한 총적 인 고찰을 한다. 그다음 콤 
퓨터산수연산과 같은 ALU 에서의 복잡한 개 념 들에 중점 을 두고 론의한다. ALU 가 수행 
하는 론리 기 능은 제 9 장에서 고찰하며 간단한 론리 회 로의 실현과 수자론리 회 로의 산수기 
능은 이 책 의 부록 A 에 서 술한다. 

콤퓨터의 산수연산은 일반적으로 완전히 서로 다른 두가지 형의 수들인 옹근수와 류 
점수에 의하여 진행된다. 어떤 형의 수들을 리용하든지간에 수의 표현법을 선택하는것은 
산수연산을 론의 함에 있어서 매 우 중요한 설계자료로서 우선적 으로 취 급되 여 야 한다. 

수체계에 대한 구체적 인 내용은 이 장의 부록을 참고하면 된다. 
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제 1 절. 산수 및 론리연산장치 

ALU 는 자료의 산수-론리연산을 실지 로 수행하는 콤퓨터 의 한 부분이 다. 조종장치， 
등록기，기 억 기，입 출력 장치 ( F 0 ) 와 같은 콤퓨터 체 계 의 다른 모든 구성 요소들은 기 본적 
으로 ALU 에 자료를 보내 여 거 기 에서 처 리를 한 다음 그 결과들을 가져 간다. 일반적으 
로 ALU 에 대 하여 생 각할 때 그것 을 를퓨터 의 핵 심 부로 론의하여 왔다. 

콤퓨터 에 서 ALU 와 모든 전자구성 요소들은 2 진수자를 기 억하거 나 간단한 불 
( Boolean ) 론리 연산을 수행 할수 있는 단순한 수자론리 장치들로 구성된다. 수자론리 를 실 
현하는데 흥미가 있는 독자들은 이 장의 부록을 참고하면 된다. 

그림 8-1 에는 일반적으로 ALU 
가 처 리장치의 다른 구성요소들과 
어떻게 호상 련결되는가를 보여 
주었 다. 자료는 등록기 에 서 ALU 로 
들어 가며 연산결과는 등록기에 
기억된다. 이 등록기들은 ALU 에 
신호경 로로 련결되 는 처 리 장치 의 
림 시 기 억 위 치 이 다(그림 2-3 참고) . 
ALU 는 또한 연산결과로써 기 발을 
설정 하기도 한다. 실례 로 자리넘 침 
기발은 계산결과가 그것을 기억하 
는 등록기길이를 초과하는 경우에 
1 로 설정된다. 기 발값은 처 리 장치내 의 등록기 들에 기 억된다. 조종장치 는 ALU 의 연산， 
ALU 로 들어 오거 나 ALU 에서 나가는 자료를 조종하는 신호를 만들어 낸다. 

제 2절. 옹근수표현 

2진수체계 (부록 8-1 참고)에서 임의의 수는 수자 0과 1，부호와 주기 혹은 소수점으 
로 표현할수 있다. 실례를 들면 다음과 같다. 

-1101.0101 2 = -13.3125 10 

보통 콤퓨터 에 서 는 이 수들을 기 억 하거 나 처 리 해 야 하므로《 一》부호와 주기 는 리 용하지 
않는다. 콤퓨터에서는 수를 표현하는데 2 진수자 0 과 1 만을 리용한다. 정의 옹근수만을 
리 용하는 경 우 수의 표현은 매 우 간단하다. 8bit 의 단어 는 0 부터 255 까지 의 수를 표현한 
다. 실례를 들면 다음과 같다. 

00000000 = 0 
00000001 = 1 
00101001 = 41 
10000000 = 128 
11111111 = 255 

일 반적 으로 n-bit 의 2 진수자렬 an - ian - 2 ••- 라的 이 부호 없는 옹근수 A 로 표현된다면 
그 값은 다음과 같다. 
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그림 8-1. ALU 의 입 구와 출구 




n-l 

A = £ 2 ; a ; 


1. 부호-크기표현 

정의 옹근수는 물론 부의 옹근수를 표현하는데는 여러가지 대응규칙들이 있는데 이 
규칙들에서는 단어에서 맨 웃자리비트(제일 왼쪽에 있는 비트)를 모두 부호비트로서 취 
한다. 다시말하여 제 일 왼쪽에 있는 비트가 0 이면 그 수는 정수이고 1 이면 부수이다. 

부호비 트를 리 용한 가장 간단한 수표현방법 은 부호 - 크기 ( sign - magnitude ) 표현법 이 다. 
이 표현법에서는 n - bit 로 된 단어인 경우 제일 왼쪽에 있는 부호비트 ( n 번째 비트)를 제 
외한 나머지 오른쪽 ( n - l ) 개의 비트들이 옹근수의 크기를 표현한다. 실례를 들면 다음 
과 갈다. 

+ 18 = 00010010 
_ 18 = 10010010 부호-크기 

이것을 일반화하여 표현하면 다음과 같다. 

0 

( 8 - 1 ) 


부호一크기표현법은 여 러가지 부족점을 가지고 있다. 하나의 부족점은 필요한 연산 
을 수행 하자면 그 연산에 참가하는 수들의 부호와 크기를 모두 고려해 야 한다는것 이 다. 
이 와 같은 내 용은 제 3 절에서 구체적 으로 론의 한다. 다른 하나의 부족점은 0 을 두가지로 
표현하는것 이 다. 

+ 0 10 = 00000000 

_0 10 = 10000000 (부호-크기 ) 

이 것은 단일한 표현법 을 리용할 때보다 0 이 있는 연산을 더 힘들게 하며 따라서 쓰기 
불편하다. 0은 콤퓨터 에 서 연산에 많이 참가한다. 

이 와 같은 부족점 으로부터 부호 一 크기 표현법 은 ALU 의 옹근수표현에 드물게 리 용된 
다. 그대 신 가장 널리 리용되는 표현법은 다음에 보게 되는 2의 보수표현이 다. 

2. 2 의 보수표현 

부호_크기표현법과 마찬가지로 2 의 보수표현은 부호비트로써 맨 웃자리비트를 리 
용하며 이 비트에 의해 옹근수가 정수인가 부수인가를 쉽게 구별할수 있다. 이 표현법에 
서 는 부수인 경 우 부호비 트를 제외한 다른 비 트들이 변화된다는것 이 부호-크기 표현법과 
차이난다. 표 8-1 은 이 절과 다음절에서 보게 되는 2의 보수표현와 그 연산의 기본특성 
을 보여 주고 있다. 

2 의 보수표기법에 대한 다수 취급은 부수를 만드는 규칙에 기본을 두고 있다. 그러 
나 이 절과 제 3절에서 고찰하는 내 용들은 2의 보수옹근수들을 2의 보수로 표현된 비 트 
들의 무게합의 형태 로 정의 하고 있다 [ DATT 93]. 이 내용은 앞에서 고찰된 부호가 없는 
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표현나 부호-크기표현을 론의하면 명백해 진다. 이와 같이 고찰하면 2 의 보수표기를 리 
용한 산수연산규칙 이 일부 특별한 경우들에는 적용되지 않는다는것을 알수 있다. 


표 8-1. 2의 보수표현와 연산의 특성 


범 위 

_ 2 n-l 로부터 fLl 까지 

0 의 표현법 

하나 (단일) 

부 정 

대응하는 정의 옹근수의 매 비트에 대하여 불보수를 취하고 부 
호 없는 옹근수로 생 각한 결과 비 트패 턴에 1 을 더 한다. 

비 트길 이 의 
곽 장 

왼쪽에 추가하려는 비트자리를 놓고 원래 부호비트값으로 그것 
을 채운다. 

자리넘침규칙 

같은 부호를 가전 두 수가 더 해 지는 경우 결과가 원래 더 해 지 
는 두 수의 부호와 반대 로 되 는 경 우에 만 자리 올림 이 발생 한다. 

덜기 규칙 

A 에서 B 를 덜기 위하여 먼저 묘에 대한 2의 보수를 구하고 그 
다음 그것을 A 와 더한다. 


이 제 2의 보수표현법 으로 된 n-bit 의 옹근수 A 를 생 각하자. 이 때 A 가 정 수이 면 부 
호비 트 a n -i 은 령 이 다. 나머 지 비 트들욤 부호 一 크기 표현법 에 서 와 같은 형 태 로 수의 크기 를 
표현 한다. 

n-2 

A = Y, 2ia i ，요인 경우 
/ = 0 

수 0 은 정수로 고찰되며 따라서 부호비트는 0 이고 그의 크기비트들은 모두 0 이 다. 정의 
옹근수의 표현범위는 0( 크기비트들이 모두 0) 부터 2" _1 (크기비트들이 모두 1) 까지이다. 보 
다 큰 수는 더 많은 비트들을 리용하여 표현한다. 

A 가 부수이 면 부호비트 !은 1 이 다. 나머지 («-1)개의 비 트들은 2” _1 개의 값들중 임 
의의 한개를 표현한다. 따라서 부의 옹근수표현범위는 -1 부터 -2 ” _1 까지이 다. 2의 보수 
표현에서 부의 옹근수에 대 한 비트값할당은 부호 없는 옹근수연산과 류사한 간단한 방법 
으로 할수 있다. 부호 없는 옹근수표현에서는 비트표현으로부터 옹근수값을 계산하기 위 
한 가장 큰 무게를 가지는 비트가 +2” _1 이다. 부호비트를 가진 즉 부호 있는 옹근수표현 
에서는 가장 큰 무게를 가지는 비트가 -2” _1 인 경우에 필요한 연산속성들이 엄어 지도록 
옹근수값이 만들어 진다. 이 내 용은 제 3 절에서 구체 적 으로 고찰한다. 이상과 같은것 이 2 
의 보수표현에서 리용되는 규칙이며 이것을 리용하면 부수인 경우 다음과 갈은 표현식을 
쓸수 있다. 


n-2 

2의 보수 A = - 2 n_1 a^i + ^2， a ; (8-2) 

i=0 

정의 옹근수인 경우는 a „- i = 0 이며 식 8-2 에서 -2 n_1 fl „- x = 0 이 다. 결국 식 8-2 는 정수 
와 부수에 대한 2의 보수식을 정의한것이라고 볼수 있다. 

2 의 보수표현은 그림 8-2 에서와 같이 기하학적인 고찰을 통해서도 잘 알수 있다 
[ BENH 92]. 그림 에서 매 부분의 웃절 반에 있는 원은 수축선의 알맞는 토막을 선택 하고 
그 점들과 대응시켜 엄은것이다. 원우의 임의의 수에서 생각하면 그 수에 + k 를 더하는것 
(혹은 -k 를 더는것)은 시계바늘방향으로 k 자리 옮기면 되고 그 수로부터 +k 를 더는것 
(혹은 -k 를 더하는것)은 시계바늘과 반대방향으로 노 자리 옮기면 된다. 만일 산수연산이 
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끝점들이 접하는 점을 거쳐 진행되면 정확한 답이 얻어 지지 않는다. 

표 8-2 에서는 4 bit 의 옹근수인 경우 부호一크기표현법과 2의 보수표현법을 대비하였 
다. 2 의 보수표현은 사람이 리해하기에는 어려운 표현법이지만 가장 중요한 산수연산인 
더하기와 덜기를 쉽게 하므로 처리장치들에서 옹근수를 표현하는데 가장 널리 리용되고 
있 다. 


표 8-2. 4bit 옹근수들의 서 로 다른 표현 


10 진표현 

부호-크기 표현 

2의 보수표현 

편위표현 

+7 

0111 

0111 

1111 

+6 

0110 

0110 

1110 

+5 

0101 

0101 

1101 

+4 

0100 

0100 

1100 

+3 

0011 

0011 

1101 

+2 

0010 

0010 

1010 

+1 

0001 

0001 

1001 

+0 

0000 

0000 

1000 

-0 

1000 


0111 

-1 

1001 

1111 

0110 

-2 

1010 

1110 

0101 

-3 

1011 

1101 

0100 

-4 

1100 

1100 

0011 

-5 

1101 

1011 

0010 

-6 

1110 

1010 

0001 

-7 

1111 

1001 

0000 

-8 


1000 



2의 보수표현의 본질에 대한 유익한 설명은 2의 보수값함을 리용해서도 할수 있다. 
이 값함은 함에서 제일 오른쪽에 있는 값이 1(2 ᄋ)이며 왼쪽에서 그다음위치의 값은 오른 
쪽 위치에 있는 값의 2배이다. 이렇게 제일 왼쪽에 있는 비트까지 계속되며 제일 왼쪽에 
있는 비트는 〈一〉 값을 가진다. 그림 8-3 자에서 볼수 있는바와 같이 표현될수 있는 가 
장 큰 부의 2 의 보수는 _2 n_1 이 다. 부호비트를 제외한 임의의 비 트들이 1 인 경 우 그에 
대응하는 수들을 더한다. 또한 부수는 제일 왼쪽에 있는 비트가 1 이고 정수는 이 비트가 
0 이 다. 따라서 가장 큰 정수는 부호비트가 0 이고 나머지비트들은 모두 1 인 수이며 그 
값은 2 n 丄 _ 1 이 다. 

그림 8-3 의 l 와 n 는 2 의 보수를 10 진수로，10 진수를 2 의 보수로 변환하는 값함 
의 리용을 보여 주고 있다. 

3. 각이한 비트길이를 가진 2진수들사이의 변환 

우리는 때때로 m < n 인 경우 n - bit 의 옹근수를 취하여 그것을 m - bit 의 옹근수로 기 
억해야 할 필요성을 느끼게 된다. 부호 一 크기표기법을 리용하면 이것을 쉽게 실현할수 
있다. 즉 부호비트를 새로운 맨 웃자리로 옮기고 그 사이를 0 으로 채우면 된다. 실례를 
들면 다음과 같다. 
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+18 = 

00010010 

(부호-크기， 8 bit ) 

+18 = 

0000000000010010 

(부호-크기 ， 16 bit ) 

-18 = 

0010010 

(부호-크기， ■) 

+18 = 

■0000000 이 0010 

(부호-크기， 16 bit ) 


이 과정은 부의 옹근수에 대한 2의 보수에서는 적용되지 않는다. 우와 같은 실례를 고찰 
하면 다음과 같다. 


+18 = 

00010010 

(2 의 

보수， ■) 

+18 = 

0000000000010010 

(2 의 

보수, 16 bit ) 

-18 = 

11100110 

(2 의 

보수， 8 bit ) 

+18 = 

1000000001101110 

(2 의 

보수， 16 bit ) 


마지 막행 의 전행 은 그림 8-3 의 값함을 리 용하여 쉽 게 알수 있 으며 마지 막행 은 식 8-2 를 
리 용하여 증명할수 있 다. 



'法1 - 

그림 8-3. 2 의 보수로 된 2진수와 10진수사이 변환에서 값함의 리용 
ᄀ- 8 자리 2 의 보수값함, l -2 진수 10000011 을 10 진수로 변환， 
n-10 진수 -120 을 2 진수로 변환 

2 의 보수표현옹근수인 경우는 부호비트를 새로운 맨 웃자리로 옮기고 그사이를 부 
호비트로 채우면 된다. 즉 정수이면 0을 채우고 부수이면 1 을 채운다. 이것을 부호확장 
이 라고 한다. 이 규칙 을 리 용하면 _18은 다음과 같이 확장된 다. 

-18= 11101110 (2 의 보수， 8 bit ) 

-18= 1111111111101110 (2 의 보수， 16 bit ) 

규칙 을 해석 적 으로 고찰하기 위 하여 n-bit 의 2 진수 a n_1 을 2 의 보수옹근수 A 라고 
생각하면 그 값은 다음과 같이 표현된다. 


A=-r^ n _ l+ f,2\ 

i=0 
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A 가 정수이면 이 규칙 은 명 확히 성 립한다. 이제 A 가 부수이 고 m>n 인 경우 A 를 m-bit 
로 확장한다면 그때 A 는 다음과 같이 표현된 다. 


A 네 _ 1 + 受 2 、 

i=0 

이 두 값이 반드시 갈아야 하므로 다음과 같이 쓸수 있다. 

- 2 m_1 + 로 2 ; a ; = -2" -1 

i=0 i=0 

m-2 

_ 2 m-l + ^ 2 < a . =_ 2 n_l 

i=n-l 

m-2 

+ ^2'a ( - =2 m_1 

i=n-l 

n-2 m-2 m-2 

i + 之 2 치 2 s = i +:£>_ 

i=0 i=n-l i=0 

i=n-l i=n-l 

=> a m-l = a m-2 = ••- = a„- 2 ■=■ a„_i = 1 

식의 전개에서는 첫 식에서 두번째 식으로 가면서 두 표현들에서 맨 아래자리 
( n - l)bit 가 변화되지 않도록 식을 써서 마지막식으로부터 두번째 식까지 간다. 마지막식 
은 ( n - l)bit 위치로부터 ( m -2 )bit 위치까지 모든 비트들이 1 인 경우에만 성 립한다. 결국 
부호확장규칙은 성 립 한다. 

4. 고점수표현 

앞에서 론의한 표현이 때로는 고점수에도 귀착된다. 이것은 소수점 (수를 둘로 갈라 
놓은 점，간단히 2분할점 ) 이 고정 적 으로 맨 아래 자리비 트의 다음 오른쪽에 있 다고 가정 
하였기때문이다. 프로그람작성자들은 일부 다른 위치로 소수점을 옮겨 수들을 소수점화 
하여도 앞에서와 같은 표현원리를 리용할수 있다. 

제 3 절. 옹근수산수연산 

이 절에서는 2의 보수로 표현된 수들의 일 반적 인 산수연산기능을 고찰한다. 

1.부정 

부호 一 크기표현법 에서는 옹근수의 부정 을 만드는 규칙 이 간단하다. 즉 부호비 트를 
반전시킨다. 2의 보수표현법에서는 옹근수의 부정 이 다음과 갈은 규칙에 따라 진행한다. 
1. 부호비트를 포함한 옹근수의 매 비트의 불보수를 취한다. 다시말하여 옹근수비트 
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들에서 1을 0으로，0 을 1로 만든다. 

2. 결과를 부호 없는 2 진옹근수로 보고 거기 에 1 을 더한다. 

이 두 단계의 처 리를 2의 보수연산 혹은 옹근수의 2의 보수취 하기 라고 한다. 실례를 들 
면 다음과 같다. 

+18 = 00010010 (2 의 보수) 

비트반전보수 (1 의 보수) = 11101101 

土_1 

11101110 = -18 

2의 보수표현의 원리로부터 2의 보수로 표현된 수의 2의 보수는 그 수자체라는것을 
알수 있다. 즉 어떤 수의 부정의 부정은 그 수자체 이 다. 

-18 = 11101110 (2 의 보수) 

비트반전보수 (1 의보수) = 00010001 


00010010 = +18 

이제 식 8-2 에서 보여 준 2 의 보수표현의 정의식을 리용하여 2 의 보수연산의 정확 
성을 론증해 보자. 이를 위 하여 2의 보수옹근수 A 가 n 비트의 2진수자렬 a n - ian - 2 - a x 
的으로 되였다고 하면 그 값은 다음과 같이 표현된다. 

A = -2"-^^ + 

/=0 

먼저 매 비트의 부정을 취한 2 진수자렬 & & … &을 만든다. 이것을 부호 없 
는 옹근수로 보고여기에 1 을 더한다. 이렇게 엄어 진 n 비트의 2 진수자렬을 2의보수 
옹근수 B 라고 하면 그의 값은 다음과 같이 표현된다. 

= -2"' 1 a„_ 1 + 시 2’ a,. 

!=0 

고찰하려고 하는것은 A=-B 이며 이것은 A + B =0 이 라는것을의미 한다. A + B = 0 이라 
는것은 다음과 같이 쉽게 증명된다. 


A + B =- (a^ + ^) + 2"- 1 + 1 + (£ T (a,. + ^)) 


= - 2"- 1 + 1 + (^ 2 ! ) 

/=0 

= - 2"- 1 + 1 + (- 2 "~ 1 - 1 ) 

= _ 2"- 1 + 2"- 1 =0 

우의 증명 에서는 우선 1을 더할 목적 으로 옹근수 A 의 비 트반전보수를 구하고 그것을 부 
호 없는 옹근수로 가정한 다음 2 의 보수옹근수로 취하였다. 이제 두가지 특별한 경우를 
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고찰해 보자. 먼저 A =0 인 경우를 고찰하자. 쇼 가 8 bit 의 길 이를 가진다고 하면 다음과 같 
이 2의 보수가 구해 진다. 

0 = 00000000 (2 의 보수) 

비트반전보수 는 11111111 

土_1 

100000000 = 0 

우의 연산에서는 맨 웃자리비트를 초과하는데 (우의 연산에서 어두운 부분으로 표현됨 )이 
것 은 무시 된 다. 이 로부터 0의 부정 은 0 이 라는것 을 알수 있 다. 

두번째 경우는 n 비트길이의 옹근수에서 맨 웃자리비트만이 1 이고 나머지 n -1 개의 
비트는 0 인 경우이 다. 이때에는 갈은 수가 엄어 진다. 실례를 들어 8 bit 의 단어 인 경우 
다음과 같이 된다. 

-128 = 10000000 (2 의 보수) 

비트반전보수 « 01111111 

土_1 

10000000 = -128 

일부 이러한 비정상적인 현상은 피할수 없는것이다. n 비트의 단어인 경우 서로 다른 
비 트렬의 수는 2 n 개 로서 짝수이다. 크기 가 갈은 정 및 부의 옹근수를 부호一크기 표현법 
으로 표현한다면 0을 두가지로 표현할수 있다. 2의 보수표기법으로 표현하는 경우에는 0 
이 한가지로 표현되며 서로 다른 크기의 부 및 정의 수들을 표현할수 있다. 2 의 보수표 
현법 에서는 n 비트길이 인 경우 -，에 대 한 표현은 있지만 +2 n 에 대 한 표현은 없다. 

2. 더하기와 덜기 

2 의 보수더 하기를 그림 8-4 에 보여 주었다. 그림 에서 첫 4 개의 실례연산들은 정상 
적 인 연산들이다. 연산결과가 정수이면 원래 2 진표기 법 으로 표현된 정수가 엄 어 진다. 
연산결과가 부수이면 2 의 보수형태로 된 부수가 엄어 진다. 어떤 때에는 단어의 길이를 
벗 어 나는 비 트가 생 기 는데 이 것은 무시한다. 

1001 1100 0011 

+ 0101 + 0100 +0100 

1110 = -2 _0 = -2 0111 = 7 

1) L) ：|) 

1100 0101 1001 

+1111 +0100 +1010 

■1011 = -5 1001 = 자리 넘 침 _0011 = 자리 넘 침 

. 、寒公: ?分 H ) 

그림 8-4. 2 의 보수로 표현된 수들의 더하기 
1-(-7) +(+5), 1-(-4) +(+4), [-(+3) + (+4), «-(-4) + (-1), n-(+5) + (+4), U-(-7) + (6) 
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더하기에서는 그 결과가 연산에 리용한 단어의 크기보다 더 커질수 있다. 이것을 자 
리 넘침 ( overflow ) 이라고 한다. 자리 넘침이 일어 나면 ALU 는 그 결과를 리 용하지 않도록 
신호로 표현해야 한다. 자리넘침을 검출하기 위하여 다음과 같은 규칙이 적용된다. 두 수 
가 모두 정수이 거 나 혹은 부수인 경 우에 더해 지 면 자리넘 침은 그 결과부호가 더해 지 는 
두 수의 부호와 반대로 되는 경우에만 발생한다. 그림 8-4 의 n 와 y 가 바로 이러한 자 
리넘침의 실례로 된다. 자리넘침은 자리올림이 있건 없건 관계없이 일어 날수 있다. 

덜기는 다음과 같은 규칙에 따라 쉽게 진행된다. 어떤 수(더는수)를 다른 어떤 수 
(덜리는수)로부터 덜기 위하여 더는 수의 2 의 보수를 구하고 그것을 덜리는 수와 더한 
다. 결국 덜기는 그림 8-5 에서 보여 준바와 같이 더 하기를 리용하여 진행된다. 그림 8-5 
에서 마지 막 두개의 실례 는 자리넘 침규칙 이 여 전히 작용한다는것을 보여 준다. 


0010 

0101 

1011 

+ 1001 

+ 1110 

+ 1110 

1011 = -5 

_0011 = 3 

"pool = -7 

1) 

니 

n ) 

0101 

0111 

1010 

+ 0010 

+ 0111 

+ 1100 

0111= 7 

1110 = 자리 넘 침 

10110 = 자리 넘 침 

ᄅ) 

n ) 

H ) 


그림 8-5. 2의 보수로 표현된 수들의 덜기 


M = 2 = 0010 

3 = 7 = 0111 
- § = 1001 

a - M = 5 = 0101 

S = -2 = 1110 

-S = 0010 


l - M = 5 = 0101 
S = 2 = 0010 
-S = 1110 , 

n - M = 7 = 0111 

S = - 7 = 1001 

-s = 0111 , 


n - M = -5 = 1011 

S = 2 = 0010 

-s = 1110 ， 

H - M = -6 = 1010 

S = 4 = 0100 

-S = 1100 , 


그림 8-2 에 서 고찰해 보면 n 비 트의 수인 경 우 시 계 바늘이 도는 방향으로 2 n _k 위 치 
만큼 옮기면 + k 를 덜거 나 혹은 -k 를 더할수 있다는것을 알수 있다. 그런데，-노는 k 에 
대 한 2의 보수로써 정의한것 이 다. 이것은 덜기 가 더는수의 2의 보수를 더 하여 얻 어 진다 
는것을 그라프적으로 보여 주고 있다. 

그림 8-6 은 더 하기 와 덜 기연산을 수행하는데 필 요한 자료경 로와 하드웨 어 요소들을 
보여 주고 있다. 중심적 인 요소는 2 진가산기이며 이 것은 더 하기를 할 두 수들을 더하면 
그 합과 자리넘침이 산생한다. 2 진가산기는 두 수들을 부호 없는 옹근수로써 처리한다 
(가산기의 론리곱하기실현은 부록 I 에서 고찰하였다.). 더하기를 해 야 할 두수들은 가산 
기에 들어 간다. 더한 결과는 두 등록기들중 어느 하나에 기억되거나 제 3의 다른 등록기 
에 기억될수도 있다. 자리넘침지시는 한 비트자리넘침기발 (0 이면 자리넘침이 없고 1 이 
면 자리넘침이 있다.)에 기억된다. 덜기에서는 더는 수 (B 등록기)를 2 의 보수기를 리용 
하여 2의 보수로 만든 다음 가산기 에 넣 는다. 


245 



:^ ^ 71 


民며一 [ 


OF = 자리넘침비트 I_ 

SW = 스위 치 (더 하기 및 덜 기 를 선택 ) 

그림 8-6. 더하기 및 덜기의 하드웨어구성 i 윷 


3. 급하기 

더하기나 덜기에 비하면 곱하기는 그것을 장치적으로 수행하든 프로그람적으로 수 
행하든 관계없이 복잡한 연산이다. 현재 각종 형태의 곱하기연산알고리듬이 각이한 콤퓨 
터들에서 리용되고 있다. 이 소제목의 목적은 독자들에게 대표적인 형태의 곱하기방법들 
을 일정 하게 인식시키 자는데 있다. 먼저 두개의 부호 없는(부수가 아닌) 옹근수들을 서로 
곱하는 간단한 문제를 고찰하고 다음에 2 의 보수로 표현된 수들에서 리용되는 가장 일 
반적 인 곱하기방법 들중 하나를 고찰하기 로 한다. 

부호 없는 옹근수급하기 

그림 8-7 은 종이와 연필을 리용해서 할수 있는 부호 없는 2 진옹근수들의 곱하기를 
보여 준다. 곱하기에 대한 몇가지 중요한 고찰들은 다음과 같다. 

1. 곱하기는 곱하는수의 매 자리에 대하여 하나씩 부분적 이 생긴다. 이 부분적들이 
서로 더해 져 최종적인 적이 얻어 진다. 

2. 부분적의 정의는 매우 쉽다. 곱하는수의 어떤 비트가 0 이면 부분적 이 0 이고 1 이 
면 부분적은 곱해지는수와 같다. 

3. 전체 적은 부분적을 서로 더하여 얻 어 진다. 이 연산에서는 매 개의 련속되는 부 
분적 이 선행한 부분적 에 대 하여 상대적 으로 왼쪽으로 한자리 밀 리워 얻 어 진다. 

4. 2 개의 n-bit 2 진옹근수의 곱하기는 그 결과가 2 n_bit 길 이를 가진다. 

연필 을 가지 고 종이장우에 서 계 산하는 방법 에 비 하여 보다 효과적 으로 곱하기연산을 
할수 있는 몇가지 방법들이 있다. 우선 부분적이 다 엄어 질 때까지 기다리지 않고 부분 
적 에 대 한 계 주연산을 진행하는 방법 이 다. 이 방법 은 모든 부분적 을 기 억 하지 않아도 되 
며 얼마간의 등록기들이 있으면 된다. 다음으로는 부분적을 얻는데서 일부 시 간을 절약 
하는 방법 이 다. 곱하는수에서 1 인 비트에 대 해서는 더 하기 와 한번의 밀기연산이 진행되 



지 만 0 인 경 우에 는 밀 기연산만 한다 
그림 8-8 1는 이와 같은 두가지 
을 리용한 곱하기실현과정을 보여 죡 
다. 곱하는수와 곱해지는수는 두개으 
기 Q 와 M 에 각각 넣어 진다. 세번 
록기인 A 등록기는 초기에 0으로 설: 
또한 초기 에 0 으로 설정 되 는 한비 j 
등록기가 있는데 이것은 더 하기연“ 
생 기는 자리 올림비 트를 기 억하게 된 
곱하는수의 연산은 다음과 같이 : 
비 트만을 읽 는다. Q 0 이 1 이 면 곱해 지 는: 
욕된다. 이때 자리넘침이 생기면 C 비트어' 
이 오른쪽으로 한비트 밀 린다. 결과 C 우 
. Q 0 이 0 이 면 더 하기 연산은 진행 되 지 



2진수곱하기의 하드웨어실현 







단지 밀 기연산만 진행한다. 이 과정 은 곱하는수의 모든 비 트에 서 반복된다. 2 n-bit 의 결 
과적 인 적은 A 와 Q 등록기 에 남게 된다. 이와 같은 연산흐름도를 그림 8-9 에 보여 주었 
으며 그림 8-8 u 에는 그 실례 들이 제시되 여 있다. 이 흐름도를 통하여 곱하는수의 비 트 
가 0 인 경 우에 는 더 하기연산을 하지 않는다는것 을 알수 있 다. 



A，Q 의 적 


그림 8-9. 부호 없는 2진수곱하기의 흐름도 


2의 보수급하기 

앞에서 고찰한 더하기와 덜기연산에서는 2 의 보수로 표현된 수들을 부호 없는 옹근 
수로 보고 계산하였다. 이제 다음과 같은것을 생각하자. 

1001 
+ 0011 
1100 

이 연산에 서는 두 수들을 부호 없 는 옹근수로 보고 9(1001) 와 3(0011) 을 더하여 
12(1100) 을 엄는다. 2의 보수옹근수라고 하면 -7(1101) 에 3(0011) 을 더 하여 -4(1100) 
를 얻게 된다. 

이와 같은 간단한 방법 이 곱하기 에서는 성 립되지 않는다. 이것을 보기 위하여 그림 
8-7 을 다시 고찰하자. 그림 8-7 에서는 11(1011) 에 13(1101) 을 곱하여 143 (10001111) 을 
엄는 과정을 보여 주고 있다. 이 수들을 각각 2의 보수로 본다면 -5(1011) 에 -3(1101) 을 
곱할 때 -113(10001111) 이 된다. 이것은 곱해지는수와 곱하는수가 모두 부수인 경우에는 
간단한 곱하기로 결과를 엄을수 없다는것을 명백히 보여 주고 있다. 실지로도 곱하는수 
와 곱해지는수가 모두 부수인 경우에 우의 연산은 성립되지 않는다. 이 사실을 설명하기 
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위하여 2의 제 곱으로 된 수인 경 우 그림 8-7 의 연산에 서 수행 되 는것 이 무엇 인지 를 고찰 
해 보자. 보통 임의의 부호 없는 2진수는 2 의 제곱의 합형 태 로 표현할수 있다. 그러 므로 
1101 = 1乂2 3 +1乂2 2 +예 +1 x 2° 

= 2 3 + 2 2 + 2 ° 

2 n 의 2 진수곱하기는 그 수를 n_bit 만큼 왼쪽으로 밀어 수행된다. 이것을 리용하면 그림 
8-10 에서 와 같이 명백한 곱하기의 부분적 이 발생하게 된다. 그림 8-10 과의 차이점은 
n-bit 의 곱해지는수로부터 산생된 2 n-bit 의 수로서 부분적 이 고찰되였다는것뿐이다. 

이로부터 부호 없는 옹근수로서 4 bit 의 곱 
해지는수 1011 은 8 bit 의 단어 00001011 로 
기 억된다는것을 알수 있다. 매 부분적 (2 G 에 
대한것은 제외) 은 왼쪽으로 밀기된 수들로 
이루어 진다. 실례로 1011 이 왼쪽으로 두자 
리 밀 리 우면 00101100으로 된다. 

이상과 갈은 고찰에 기초하면 곱해지는수 
가 부수인 경우에는 직접적인 곱하기가 성 
립되지 않는다는것을 알수 있다. 문제는 부 
분적으로 되는 부의 곱해지는수의 매 값들 
이 2 n-bit 마당에서 반드시 부수여 야 한다는 
것이다. 다시말하여 부분적의 부호비트들은 한줄로 일치되여야 한다. 이것을 그림 8-11 
을 통하여 고찰해 보자. 이 그림에서는 1001의 곱해지는수에 0011을 곱하는 연산을 각각 
보여 주고 있다. 이 수들을 부호 없는 옹근수로 보면 9 X 3 = 27 의 곱하기연산은 간단히 
진행 된다. 그러 나 10()1 을 2 의 보수 -7 로 보게 되 면 그림 8-11 l 에서 보여 준바와 같이 
매 부분적은 2 n (8) 비트의 부의 2 의 보수로 되여 야 한다. 이를 위하여 2 진수자 1로 매 
부분적의 왼쪽을 채운다. 


1011 

X11Q1 

00001011 1011X1X2° 

00000000 1011 X 1 X 2 1 

00101100 1011 X 1 X 2 2 

01011000 1011 X 1 X 2 3 

10001111 

그림 8-10. 8 bit 결과를 낳는 두 부호 없는 
4 bit 옹근수들의 곱하기 


1001 (9) 

XQQ 11 (3) 
00001001 1001 x 2° 

00010010 1001 x 2 1 

00011011 (27) 


1001 (-7) 

XQQ 11 (3) 

11111001 (-7) X 2° = (-7) 
11110010 (-7) x 2 1 = (-14) 
11101011 (- 21 ) 


T-) 


그림 8-11. 부호가 없거나 2의 보수로 된 옹근수의 곱하기연산비교 
n - 부호 없는 옹근수， i _-2 의 보수옹근수 


곱하는수가 부수인 경우에 도 직접적 인 곱하기연산은 성 립 되지 않는다. 그 리유는 곱 
하는수의 비 트들 이 더 는 수행 해 야 할 밀 기 나 곱하기 에 부합되 지 않기 때 문 이 다. 실 례 로 
10 진수 -3 은 4 bit 의 2 의 보수로서는 1101이 된다. 만일 매 비트위 치 에 기 초하여 부분 
적을 취한다면 다음과 같이 쓸수 있을것이다. 

110 U —-( lx 2 3 + lx 2 2 +0 X 2 1 + lx 2 0 ) = -(2 3 +2 2 +2 0 ) 

실지로 -3 은 _(2 1 + 2 g ) 토 표현된다. 이로부터 우에서 서술한 방법에서는 이 곱하는 수를 
직 접 리 용할수 없다. 이 것을 해 결하기 위한 여 러 가지 방도들이 있다. 
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한가지 방법은 곱하는수와 곱해지는수를 모두 정수로 바꾸어 곱하기를 수행 하고 곱 
하기 에 참가하는 두 수의 부호가 다른 경우에만 곱하기 에 대 하여 2 의 보수를 취 하는것 
이다. 그런데 보수기들은 최종 곱하기결과를 변형하지 않는 기술을 더 많이 리용하고 있 
다. 이러한 방법들가운데서 가장 일반적인 방법의 하나가 바로 부스 ( Booth ) 의 알고리듬 
이 다. 이 알고리 듬은 보다 직 접적 인 방법 으로 곱하기처 리속도를 높인다는 우점 을 가지 고 
있 다. 

부스의 알고리 듬을 그림 8-12 에 보여 주었 다. 이 그림은 다음과 같이 설명된다. 앞에서 
와 같이 곱하는수와 곱해 지 는수를 특별 히 Q 와 M 등록기 에 각각 배 치 한다. 또한 Q 등록기 의 
맨 아래자리비트 (九의 오른쪽에 배치되는 Q_l 이라고 부르는 lbit 등록기가 있다. 이 등록기 
의 리용은 뒤에서 간단히 설명된다. 곱하기결과는 A 와 Q 등록기들에 나타난다. A 와 Q _ l 은 
초기에 0 으로 설정된다. 조종론리는 앞에서와 같이 곱하는수의 비트들을 주사한다. 어느 한 
비트가 1 인가 0 인가 결정되면 그의 오른쪽 비트는 다음에 시험된다. 이 두 비트들이 같은 
경 우에 (1 _ 1 혹은 0 _ 0) A , Q 및 Qd 등록기 들의 모든 비 트들이 한 비 트 오른쪽으로 밀 리우 
게 된다. 두 비트들이 서로 다른 경우에는 곱해지는 수가 A 등록기에 더해 지거나 A 등록기 
로부터 덜어 지는데 이것은 두 비트들이 0-1 인가 1-0 인가에 관계된다. 더하기와 덜기에 뒤 
따라 오른쪽 밀기가 진행된다. 어느 경우에도 오른쪽밀기는 A 의 최고비트 A n _ 2 토 밀리우거 
나 Am 에 그냥 머무르는 연산이 다. 이것은 A 와 Q 에서 수들의 부호를 보존하기 위 한것 이 다. 
수들의 부호가 보존되므로 이것을 산수밀기라고 한다. 





그림 8-12. 2의 보수곱하기를 위한 부스의 알고리듬 
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그림 8-13 은 7과 3의 곱하기를 위한 부스의 알고리듬에서 사건들이 일어 나는 순서 
를 보여 주고 있다. 


0000 

0011 

0 0111 

초기값 



1001 

0011 

0 0111 

A，一A - M 

청 주기 

1100 

1001 

1 0111 

밀기 



1110 

0100 

1 0111 

밀기 

둘째 

주기 

0101 

0100 

1 0111 

A，一 A + M 

셋째 

주기 

0010 

1010 

0 0111 

밀기 

0001 

0101 

0 0111 

밀기 

넷째 

주기 


그림 8-13. 부스의 알고리듬의 실례 


그림 8-14 에서는 이 연산을 보다 함축하여 보여 주고 있다. 그림 8-14 에서 자를 제 
외 한 나머지부분들은 부스알고리듬의 다른 실례들을 보여 주고 있다. 이 실례들로부터 
정수와 부수의 임의의 결합에 대해서도 부스알고리듬이 성립한다는것을 알수 있다. 또한 
알고리듬의 효과성도 알수 있다 . 1이나 0으로 된 블로크들은 블로크당 한번의 더하기 혹 
은 덜기만의 평균을 가지고 건너 뛰게 된다. 

0111 0111 1001 1001 
'公0011 (0) 效1101 (0) X0011 (0) X1101 (0) 

11111001 1-0 11111001 1-0 00000111 1-0 00000111 1-0 

0000000 1-1 0000111 0-1 0000000 1-1 1111001 0-1 

000111 0-1 111001 1-0 111001 0-1 000111 1-0 

00010101 (21) 11101011 (-21) 11101011 (-21) 00010101 (21) 

1_) 2| 

그림 8-14. 부스알고리듬을 리용한 실례 

-I- (7) X ⑶ = (21 、%- |7) X (-3) = (-21) ， C - (_7) X ⑶ = (-21) ， 5- (-7) 效 . ᅡ 3) = (21) 

부스알고리 듬이 왜 성 립 하는가?우선 곱하는수가 정수인 경우를 고찰하자. 이를 위하 
여 0 으로 둘러 막힌 1 의 련속렬 로 된 블로크(수자렬) 례 를 들면 00011110 과 같은 정 의 
곱하는수를 생각하자. 다 아는바와 같이 곱하기는 곱해지는수를 곱하는수에 따라 밀기한 
부분적들을 모두 더하여 수행된다. 

Mx(00011110) = Mx(2 4 +2 3 +2 2 +2 1 ) = 

= Mx(16 + 8 + 4 + 2) = 

= Mx30 

연산회수는 다음과 같이 하면 두번으로 감소시킬수 있다. 


2" + 2니 + … + 2" 나 =2' 


(8-3) 
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따라서 


Mx (00011110) = Mx (2 5 -2 1 ) = 

= Mx (32-2) = 

= Mx 30 

그리하여 곱하기결과인 적은 곱해지는수의 한번의 더하기와 한번의 덜기에 의해 얻 
어 질수 있다. 이 방법은 곱하는수가 모두 1 인 비트들로 된 경우를 포함하여 곱하는 
수에 련속 1 인 부분이 있는 임의의 수에로 확장할수 있다. 따라서 다음과 같은 실례 
를 들수 있다. 

M x (0001 11 10) = M x (2 6 + 2 5 + 2 4 + 2 3 + 2 1 ) 

= Mx (2 7 -2 3 + 2 2 -2 x ) 

부스알고리듬은 블로크의 첫번째 1 이 (1_ 0)과 만나게 되면 덜기를 수행하고 블로크의 
끝이 (0 — 1) 과 만나게 되면 더 하기를 수행하여 이 형식 에 부합되게 한다. 

이 상과 갈은 방법 이 부의 곱하는수에 서 도 성 립 하는가를 보기 위하여 다음과 갈은것 
을 고찰하자. X 가 2의 보수로 표현된 부수라고 하면 표 는 다음과 같이 표현된 다. 

표의 표현 1={1民_ 2 民시..지凡 } 

이 X 값은 다음과 같이 쓸수도 있 다. 

X = - 2"- 1 + ( X n _ 2 x 2니 ) + ( X „_ 3 x 2니 ) + … + (Xi x 2 1 ) + ( X 0 x 2 0 ) (8-4) 

식 8-4 는 표 8-2 에 있는 수들에 부스의 알고리 듬을 적 용하면 엄 어 진다. 

보의 제 일 왼쪽 비 트는 표 가 부수이 므로 1 이 다. 이제 0 이 왼쪽으로부터 k 번째 의 위 
치에 있다고 가정하자. 그러면 표는 다음식으로 표현되는 수일수 있다. 

표의 표현 Z ={111...10 X ,. 1 X ,_ 2 ... X 1 X 0 } (8-5) 

조의 값은 다음과 같이 쓸수 있다. 

X = -2"- 1 + 2"- 2 +... + 2 k ~ l + ( X ^ x 2 n - 1 ) + … + ( X 0 x 2 0 ) (8-6) 

식 8-6 으로부터 다음과 갈은 식 을 생 각할수 있 다. 

2"- 2 + 2 n ~ 3 + ... + 2 科 1 = 2"- 1 - 2 k+l 

웃식을 재배치하면 다음과 같다. 

- 2 n ~ 2 + 2"_ 2 + 2"~ 3 +... + 2 k+1 = - 2 k+1 ( 8 - 7 ) 

식 8-7 을 식 8-6 에 대 입하면 다음과 갈은 식 을 엄 을수 있 다. 

X = - 2 k ~ l + ( X ^ x 2 k - 1 ) + … + ( X 0 x 2 0 ) (8-8) 

결국은 부스알고리듬으로 돌아 왔다. X 의 표현 [식 8-5] 을 상기 하면 X 0 으로부터 왼 
쪽에 서 제 일 첫 0까지 의 모든 비 트들이 알맞게 조종된 다는것 이 명 백하다. 그것 은 비 트들 
이 식 8-8 의 (_2 i + 1 ) 을 제외한 모든 항들을 만들며 따라서 적 합한 양식 으로 된다. 알고 
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리듬이 왼쪽으로부터 제일 첫 0을 주사하고 그다음 l (2 i+1 ) 과 만나므로 1-0 변화가 생기 
며 덜기가 (_， +1 )에서 일어 난다. 이것은 식 8-8 에서 나머지항이다. 

실례로 -6 에 곱해지는수를 곱하는 경우를 생각하자. 2 의 보수로 표현된 8 bit 단어를 
생각하면 -6 은 11111010으로 표현된다. 식 8-4 를 리용하면 -6 은 다음과 같이 표현된다. 


따라서 


- 6 = - 2 7 + 2 6 + 2 5 + 2 4 + 2 3 + 2 1 
Mx ( lllllOlO ) = Mx (-2 7 +2 6 +2 5 +2 4 +2 3 +2 1 ) 


웃식 에 식 8-7 을 적 용하면 된 다. 


Mx ( lllllOlO ) = Mx (-2 3 + 2 1 ) 


이 로부터 여 전히 M X (-6) 이 라는것을 확증할수 있다. 마지 막으로 이미전에 증명 되 여 확 
증된 방법에 준하면 웃식을 다음과 같이 쓸수 있다. 

Mx(11111010) = Mx(-2 3 +2 2 -2 1 ) 

결국 부스알고리듬이 이 형식에 맞는다는것을 알수 있다. 첫 1 이 (1-0) 과 만나게 될 때 
에는 덜기를 하고 (0-1) 을 만나게 되면 더하기를 한다. 또한 1로 된 다음 블로크에서 첫 
1 을 만나면 또 다른 덜기를 한다. 그러므로 부스알고리듬은 직접적인 알고리듬보다 더 
적은 수의 더하기와 덜기를 수행한다. 

4. 나누기 

나누기는 곱하기보다 더 복잡하지만 일반적으로 같은 원리에 기초하고 있다. 알고리 
듬의 기본원리는 곱하기와 마찬가지로 종이장우에서 연필로 하는 방법으로서 이 연산은 
반복밀기와 더하기，덜기를 포함하고 있다. 



그림 8-15. 부호 없는 2 진옹근수의 나누기 


그림 8-15 는 부호 없는 2진옹근수의 나누기실례 를 보여 준다. 우선 나누어지 는 
수의 비트들이 나누는수보다 크거나 같아 지게 될 때까지 왼쪽에서부터 오른쪽으로 
가면서 검사된다. 나누어지는수가 나누는수보다 작은 경우에는 0 이 상으로서 왼쪽에 
서 오른쪽으로 가면서 배 치된다. 크거 나 같아 지 게 되 면(이 것 을 사건이 일 어 난다고 
한다.) 1 이 상으로서 배치되며 나누는수가 나누어지는수로부터 덜어 진다. 이 결과 
를 부분나머지라고 한다. 이와 갈은 과정이 반복된다. 매 주기에서는 나누어지는수 
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1. M 등록기에 나누이는수를 넣고 A 와 Q 등록기에는 나누어지는수를 넣는다. 나누어지는 
수는 2 n-bit 의 2 의 보수로 표현되는 수여야 한다.실례로 4 bit 0111 은 00000111 
로 되며 1001은 111110이로 된다. 

2. A 와 Q 의 값을 왼쪽으로 한비트 민다. 

3. M 과 A 가 같은 부호이면 A — A-M 을 수행하고 서로 다른 부호이면 A — A + M 
을 수행 한다. 

4. 앞의 연산은 A 의 부호가 연산전과 후에 같은 경우 성공으로 된다. 

T . 연산이 성 공이 거 나 ( A =0 AND Q =0) 이 면 Q 0 에 1 을 설 정한다. 
l . 연산이 성공하지 못하여 (A 與.0 AND Q 뉴 0) 이면 Q 0 에 0 을 설정하고 A 
의 이전값을 복귀시 킨다. 

5. Q 에 비트자리들이 있는 경우에는 그만큼 단계 2에서부터 단계 4를 반복한다. 

6. 나머 지 는 A 에 남는다. 나누이 는수와 나누어 지 는수의 부호가 같다면 그때 상은 Q 
에 남는다. 이 부호가 다르면 정 확한 상은 Q 의 2 의 보수이 다. 


A 

Q 

M =0011 

A 

Q 

M =1101 

0000 

0111 

초기값 

0000 

0111 

초기값 

0000 

1110 

밀기 

0000 

1110 

밀기 

1101 


덜기 

1101 


더 하기 

0000 

1110 

복귀 

0000 

1110 

복귀 

0001 

1100 

밀기 

0001 

1100 

밀기 

1110 


덜기 

1110 


더 하기 

0001 

1100 

복귀 

0001 

1100 

복귀 

0011 

1000 

밀기 

0011 

1000 

밀기 

0000 


덜기 

0000 


더하기 

0000 

1001 

Qo = 1 설정 

0000 

1001 

Qo = 1 설정 

0001 

0010 

밀기 

0001 

0010 

밀기 


T) 



니 


A 

Q 

M =0011 

A 

Q 

M =1101 

1111 

1001 

초기값 

1111 

1001 

초기값 

1111 

0010 

밀기 

1111 

0010 

밀기 

0010 


더 하기 

0010 


덜기 

1111 

0010 

복귀 

1111 

0010 

복귀 

1110 

0100 

밀기 

1110 

0100 

밀기 

0001 


더 하기 

0001 


덜기 

1110 

0100 

복귀 

1110 

0100 

복귀 

1100 

1000 

밀기 

1100 

1000 

밀기 

1111 


더하기 

1111 


덜기 

1111 

1001 

Qo = 1 설정 

1111 

1001 

Qo = 1 설정 

1111 

0010 

밀기 

1111 

0010 

밀기 


n) 



근) 



그림 8-17. 2의 보수나누기 실례들 
(7)+幻), L- (7) 우 (-3)， c- (-7) + (3)，ᄅ- (-，_■ 
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밑수 B 는 암시적이며 모든 수들에 공통이므로 기억할 필요가 없다. 

2진류점수의 표현원리는 다음의 실례 를 통해서도 잘 알수 있다. 그림 8-18 가 는 대 
표적 인 32 bit 류점수형식을 보여 주고 있다. 맨 웃자리비트는 부호비트로서 0 이면 정수，1 
이면 부수를 나타낸다. 지수값은 그다음 8 bit 에 기억된다. 지수표현에서는 편위표현법을 
리용한다. 편위 라고 하는 고정된 값은 진짜지수값을 가지는 마당으로부터 덜어 진다. 일 
반적으로 편위는 과 갈은데 여기서 k 는 2진지수에서 비트들의 개수이다. 이 경 

우에 8 bit 마당은 0 부터 255 까지의 수를 만들므로 127 의 편위 로서 는 지수값을 -127 〜 
+128의 범 위 에서 표현할수 있다. 이 실례 에서 밑수는 2이 다. 


그림 8-17 을 보면 (-7) 수 (-3) 의 연산에서 서 로 다른 나머지 가 나온다. 이 것은 나 
머지가 다음과 같이 정의되기때문이다. 

D = QXV + R 

여기서 D - 나누어지는수， 

G _ 상， 

V - 나누이는수， 

R - 나머지 

그림 8-17 의 결 과들은 이 공식 과 일 치한다. 

제 4절. 류점수표현 

1.원리 

고점 수표기 법(즉 2 의 보수) 으로는 0 을 중심 으로 정 및 부의 옹근수들을 표현할수 
있다. 고정된 두 부분 혹은 소수점을 리용한 형식은 소수성분을 가진 수들을 표현할수 
있 다. 

이러한 방법은 일부 제한성을 가진다. 즉 매우 큰 수나 매우 작은 소수들을 표현할 
수 없다. 특히 두 큰수의 나누기에서 상의 소수부분을 잃어 버릴수 있는 결함이 있다. 

10 진수에 서는 과학적 인 표기 법 을 리용하여 이 제 한성 을 극복하고 있다. 
976,000,000,000,000 은 9.76 X 10 14 으로 표현 할수 있 으며 0.0000000000000976 은 9.76 X 
10 _14 으로 표현할수 있다. 여기서 실지로 알맞는 편리한 위치로 10진점을 이동하고 그 10 
진점의 이동위 치를 나타내는 10의 제곱을 리 용한다. 이 렇게 하면 매우 큰수나 매우 작은 
수를 몇개의 자리수만으로 표현할수 있다. 

이와 같은 방법은 2 진수에도 적용할수 있으며 다음과 같은 형태로 2 진수를 표현할 
수 있다. 

±SxB ±e 

이 수는 세개의 마당을 가진 2 진단어 로 기 억된다. 


은 

혹 

+ s E 


호 수 수 
부 곁 지 
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표 8-2 는 4 bit 옹근수에 대 한 편위 형 표현법 을 보여 준다. 편위 형 표현법 의 비 트들을 
부호 없는 옹근수로서 취급하는 경우 수들의 상대적인 크기는 변하지 않는다. 실례로 편 
위 및 부호 없는 표현에서 가장 큰수는 1111이고 가장 작은수는 0000이다. 이것은 부호- 
크기，2의 보수 혹은 1의 보수표현와는 맞지 않는다. 편위 형 표현의 우점 은 부수가 아닌 
류점수들을 비교할 목적으로 옹근수로서 취급할수 있다는것 이 다. 

결수부의 

부호、 석 _ 8bits r ^_ 23bits __ 

ᄀ | 편우 1X1 수부 | 14=¥ | 


0. 11010001 X 2 01011 — ■ 0 10010011 10100010000000000000000 
-0.11010001 x 2 01011 = 1 10010011 10100010000000000000000 

0. 11010001 x 參 01011 . = 0 10010011 10100010000000000000000 

-0. 11010001 父 = 1 10010011 10100010000000000000000 


그림 8-18. 일반적 인 32 bit 류점수형식 
1- 형식, 실례 

단어의 마지막부분(그림 8-18 의 경우에는 23bit) 은 이 른바 소수부라고도 하는 결수 
부마당이다. 임의의 류점수는 여러가지 형태로 표현할수 있다. 다음의 수들은 결수부를 2 
진수형태로 표현한 모두 갈은 수들이 다. 

0.110 父 2 5 

110 X 2 2 
0. 0110 X 2 6 

류점수연산을 간단히 하자면 그 수들을 정규화 (normalization) 해야 한다. 우의 실례에서 
정규화된 령 이 아닌 수는 다음과 같이 표현할수 있다. 

±0.1bbb ...bx2 ±E 

여기서 b 는 2 진수자 0 혹은 1 이 다. 이것은 결수부의 제 일 왼쪽에 있는 비트가 늘 1 이여 
야 한다는것을 말해 준다. 그러므로 이 비트는 기억할 필요가 없다. 결국 23bit 의 마당은 
0.5 와 1.0 사이 의 값을 가진 24bit 의 곁 수부를 기 억 하는데 리 용되 는것 으로 된 다. 

그림 8-18 l 는 이와 갈은 형식으로 된 류점수들의 실례를 보여 주고 있다. 류점수표 
현의 특징은 다음과 갈다. 

• 부호는 단어의 첫번째 비트로 기억된다. 

• 결수부의 첫 비트는 늘 1 이며 따라서 곁수부마당에 기억 할 필요가 없다. 

• 값 127 은 지수부마당에 기 억되는 실지 지수에 더 해 진다. 

• 밑 수는 2 이 다. 

그림 8-19 는 이와 같은 표현원리를 리용하여 32bit 단어로 표현할수 있는 수들의 범위 
를 보여 준다. 2의 보수옹근수표현을 리용하면 -2 31 〜 2 31 —1까지의 모든 옹근수들을 표현 
할수 있으며 이것은 총체적으로 2 32 개의 서로 다른 수들을 표현할수 있는것으로 된다. 그 
림 8-18 의 실례에서 본 류점수형식에서는 다음과 갈은 범위의 수들을 표현할수 있다. 
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• - d -2" 24 ) x 2 128 과 -0.5 x 2 _127 사이 의 부수 

• 0.5 X 2— 127 과 (1-2" 24 ) x 2 128 사이의 정수 


표시 할수 있는 옹근수 



그림 8-19. 32 bit 형식으로 표시할수 있는 수 
"1-2 의 보수옹근수， l - 류점수 


그림 8-19 에서 수축선우에 있은 5개 령 역은 이 범위 에 속하지 않는다. 

• 부의 자러넘침이 라고 하는 -( l -2 - 24 )X 2 128 보다 작은 부수 

• 부의 아래자러넘침이 라고 하는 -0.5 父 2 _127 보다 큰 부수 

• 령 

• 정의 아래자러넘침이라고 하는 0.5 公:名 _127 보다 작은 정수 

• 정 의 자리 넘 침 이 라고 하는 (1-2_ 24 ) x 2 128 보다 큰 정 수 

이와 같은 표현은 0 에 대 해서는 잘 맞지 않는다. 그러 나 실지 류점수표현은 령을 가 
리키는 특별한 비트렬을 가진다. 자리넘침은 산수연산이 128의 지수로 표현할수 있는 수 
(2 120 X 2 100 = 2 22Q ) 보다 더 큰 수를 발생 시 켰을 때 일어 난다. 아래 자리넘 침은 소수부의 
크기 가 너무 작을 때 즉 (2 - 12G X 2 _1GG = 2 _22G ) 보다 작을 때 일어 난다. 아래 자리넘 침은 그 
결과가 0 에 매우 가깝게 다가가는 경우에 생기는 문제이므로 그닥 중요하게 보지는 않 
는다. 중요한것은 류점수표기에서는 보다 개별적인 값을 표현하고 있지 않다는것이다. 
32 bit 로 표현할수 있는 각이한 값들의 최 대 수는 역 시 2 32 이 다. 이 미 고찰한것 은 정 수와 
부수로 표현된 두 범위들사이에 수들을 충분히 확산시 킨것 이 다. 

또한 류점수표기법으로 표현된 수들은 고점수들과는 달리 수축을 따라 그 간격 이 균 
등하게 놓이 지 않는다. 그림 8-20 에 서 보여 준것 처 럼 수값들은 원점 에 가까울수록 그 간 
격이 조밀해 지며 원점에서 멀어 질수록 그 간격은 넓어 진다. 이것은 류점수를 취급하 
는 수학을 효과적 으로 리용할수 있는 전제 조건들중의 하나로 된 다. 많은 계 산들에 서 는 
그 결과가 정 확치 않아 가장 가까운 값으로 둥그리 기 를 하여 다시 표기해 야 할 경 우가 
생긴 다. 
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그림 8-20. 류점수의 밀:£、 


그림 8-18 에서 보여 준 류점수형식 에서 범위와 정 확도사이에는 절충방안이 있다. 여 
기서 는 지수표현에 8bit, 결수표현에 23bit 를 할당하고 있다. 만일 지수표현을 위 한 비 트 
수를 늘인다면 표현할수 있는 수들의 범위를 확장할수 있다. 그러 나 고정된 수의 각이한 
값들만이 표현될수 있으므로 이 수들의 밀도는 감소하고 따라서 정확도도 떨어 진다. 범 
위와 정확도를 둘 다 증가시키는 유일한 방도는 보다 많은 비트를 리용하는것 이다. 그리 
하여 대 다수 콤퓨터 에서는 적 어도 단정확도 및 배정확도수들을 모두 리용한다. 실례로 
단정 확도형 식 은 32bit, 배 정 확도형 식은 64bit 이 다. 

지 수표현비 트수와 곁 수표현비 트수사이에 도 절 충방안이 있 다. 그러 나 이 것 역 시 문제 
를 더 욱더 복잡하게 만든다. 그리하여 지 수의 밑 수로 2 를 리 용하지 않는 방법 을 생 각해 
냈다. 실례로 IBMS /390 콤퓨터기본방식에서는 밑수 16을 리용한다. 이 형식은 7 bit 의 지 
수부와 24 bit 의 곁수부로 되 여 있다. 이 형 식의 실례 를 들면 다음과 갈다. 

0.11010001 父 2 10100 = 0. 11010001 父 16 101 

이 식 으로부터 알수 있는바와 같이 16 진수를 리 용하면 20 이 아니 라 5 를 지 수로 쓸수 있다. 

보다 큰 밑수를 리용하면 갈은 수의 지수표현비트들을 가지고도 보다 큰 범위에 있 
는 수들을 표현할수 있 다. 그러 나 표현할수 있는 각이한 값들의 수는 증가하지 않는다. 
결국 고정된 형식에서는 보다 큰 제곱밑수가 보다 작은 정확도로 보다 큰수들의 표현범 
위를 준다는것을 알수 있다. 

2. 旧 EE 에서 표준화된 2 진류점수표현 

가장 중요한 류점수표현은 IEEE 표준 754에서 정의되 고 있다 [IEEE85]. 이 표준은 한 
처 리 장치 에 서 다른 처 리 장치 에 로 프로그람의 이 식 성 (류통성 ) 을 보장하며 고급하면서 도 
수값처 리지 향적 인 프로그람개 발을 촉진 할수 있도록 되 여 있 다. 이 표준은 현재 널 리 리 
용되 고 있으며 가상적 으로 보면 현 시대의 모든 처 리 장치들과 산수연산처 리장치 들에서 
리용하고 있 다. 

IEEE 표준에는 그림 8-21 에서 보여 준바와 같이 지수표현비트수가 각각 8, 11 인 
32bit 단정 확도형 식 과 64bit 배 정 확도형 식 이 있 다. 암시 적 인 밑 수는 2 이 다. 이 외 에 도 이 표 
준은 단정확도 및 배정확도를 가지는 2 개의 확장된 형식을 정의하고 있다. 이것들의 정 
확한 형식은 호상 독립이다. 확장된 형식에는 지수부에 추가적인 비트들(확장범위)과 결 
수부에 추가적 인 비트들(확장정확도)이 있다. 이 확장형식은 중간계산에 리용된다. 확장 
형 식의 정 확도가 크면 콜수록 지 나친 둥그리 기 오차가 최종결과에 미치는 영 향을 작게 할 
수 있다. 또한 확장형식들의 범위를 크게 하면 계산도중에 자리넘침이 일어 날 가능성 이 
작아 져 연산결과가 기 본형 식 으로 표현될수 있 다. 추가적 인 단정확도확장형 식 은 보다 높 
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은 정 확도를 얻는데 시 간을 소비 함이 없이 배정 확도형식과 갈은 우점을 나타내게 한다. 
표 8-3 은 이와 갈은 4 가지 형식의 특성들을 종합하여 보여 준다. 


부호 

비트 


부호 

비트 



ᄂ) 


그림 8-21. IEEE 754 형 식 
단정 확도형식, 배정 확도형식 


표 8-3. IEEE 754 형 식 들의 파라메 터 


파라메 터 

단정 곽도 

확장된 단정확도 

배정 확도 

확장된 배정확도 

단어 비트수 (bits) 

32 

^43 

64 

^79 

지수부비트수 (bits) 

8 

m 11 

11 

^ 15 

지수부 편위 

127 

미정의 

1023 

미정의 

최대지수부 

127 

^ 1023 

1023 

^ 16383 

최소지 수부 

-126 

드-1022 

-1022 

4^16382 

수범 위 (밑 수 10) 

10' 38 ,10+ 38 

미정의 

10" 308 ,10 +3 ° 

8 

미정의 

곁 수부비트수 (bits)* 

23 

.fe31 

52 

■ 63 

지수부들의 개수 

254 

미정의 

2046 

미정의 

곁수부들의 개수 

2 23 

미정의 

2 52 

미정의 

값들의 개수 

1.98*2 31 

미정의 

1.99*2 期 

미정의 


* 암시적 인 비트는 포함하지 않는다. 


IEEE 형식에서 모든 비트렬은 보통 방법으로 해석되지 않는다. 그대신 일부 비트렬 
들은 특별한 값을 표현하는데 리용한다. 표 8-4 는 여 러가지 비트렬에 할당된 값들을 보 
여 주고 있다. 극단적 으로 지 수부비 트렬에 서 모든 비 트들이 0 인 값과 모든 비 트들이 
1( 단정확도형식에서는 255, 배정확도형식에서는 2047) 인 값은 특별한 값으로 된다. 류점 
수로 표현되 는 수들의 표현범 위 와 일부 특이한 수들은 다음과 갈다. 

• 정규화된 령 이 아닌 류점수는 단정확도형식 인 경우 지수부가 1〜254 범위에，배정 
확도형식 인 경우 1〜2046의 범위에 있는 수를 표현할수 있다. 지수부는 편위되므 
로 지 수부의 범 위는 단정확도형 식 에서 는 -126 〜+127，배정확도형 식 에서 는 -1022 
- +1023 이 다. 정 규화된 수에 는 소수점의 왼쪽에 1 인 비 트가 하나 있어 야 한다. 
이 비 트가 곁수부에 포함되 여 유효비 트수가 단정확도형 식 에서 는 24 bit ， 배정확도 
형식 에서는 53 bit 로 된다. 

• 결수부와 지수부가 모두 0 인 수는 부호비트에 따라 +0 혹은 -0 을 표현한다. 이것은 
이미 언급된바와 같이 0 의 정 확한 값을 표현하는데 효과적 으로 리용된다. 
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이 建:如 혹은 1緣 로 될수도 있다. 

• 지수부아래자러넘침 : 부의 지수부인 경우 최소지수부값보다 작을 때 발생한다. 
(례 : -200 은 -127 보다 작다) 이것은 그 수가 너무 작아서 표현할수 없다는것을 
의미하며 이때 에는 0 으로 판단된다. 

• 결수부아래자리넘침: 곁수부정렬처리에서는 0 이나 1 의 수자들이 곁수부의 오른쪽 
끝 밖으로 벗어 날수도 있다. 이때에는 적당한 형태의 둥그리기를 해야 한다. 

• 곁 수부자리넘 침 : 갈은 부호를 가진 두 곁 수부의 더 하기 에 서 는 맨 웃자리비 트 밖 
으로 자리올림이 생길수 있다. 이것은 재정렬에 의해 고정된다. 


표 8-5. 류점수와 산수연산 


류점수 

산수 연산 

X =X s xB Xe 

Y =Y s xB Ye 

X+Y=(X s xB Xe ~ Ye +Y s )xB Ye 1 

X-Y = (X s xB Xe ~ Ye -Y s )xB Y e \ Xe ~ Ye 

xxr=(X s xr s )x 公자 +y£ 


실례 : 

X=0.3X10 2 =30 
Y=0.2X10 3 = 200 

X+Y= (0.3X10 2_3 + 0.2)X10 3 = 0.23X10 3 = 230 
X-Y= (0.3xi0 2_3 - 0.2) X10 3 =(-0.17) X10 3 =-170 
X+Y= (0.3X0.2) X10 2+3 =0.06X10® =6000 
X+Y= (0 3X0 2) X10 2 ' S -0 23X10 =0.1 & 

1. 더하기와 덜기 

류점수의 산수연산인 경우 더하기와 덜기는 곱하기나 나누기보다 더 복잡하다. 그것 
은 지수부를 반드시 일치시켜야 하기때문이다. 더하기와 덜기알고리듬에는 다음과 갈은 
4가지 기 본단계 가 있 다. 

1. 령검사 

2. 결수부들의 정렬 

3. 결수부들의 더하기와 덜기 

4. 결과의 정규화 

그림 8-22 에는 더하기와 덜기의 일반적인 흐름도를 보여 주었다. 계단식으로 전개된 
이 흐름도는 류점수의 더하기와 덜기의 기본기능을 상세히 보여 주고 있다. 류점수의 형식 
은 그림 8-21 의 류점 수형 식 과 같다. 더 하기 와 덜 기 연산에 서 는 두 연산수가 ALU 에서 리 용 
할수 있는 등록기로 전송되여야 한다. 류점수형식이 암시적인 의미비트를 가지고 있는 경 
우에는 그 비트가 연산과정에 명시적인것으로 되여야 한다. 

더 하기와 덜기 는 부호변화를 제 외하면 같은 연산이므로 그 처 리 에서는 덜기연산인 
경 우에 만 더 는수의 부호를 변화시키 고 연산을 시 작한다. 또한 두 연산수가운데 서 한 연 
산수가 0 인 경 우에 는 다른 연산수가 결과로 된다. 
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다음단계는 두 지수부가 갈아 지도록 수들을 조작하는것이다. 이를 위한 필요조건을 
보기 위하여 다음과 같은 10진수더 하기 를 고찰해 보자. 

(123 父 10°) + (456 父 10" 2 ) 

웃식 에서는 명 백히 결수부들을 서 로 더할수 없다는것을 알수 있다. 곁수부를 서로 더하 
자면 우선 그것의 지수부를 일치시켜 야 한다. 구체적 으로는 두번째 수의 4 가 첫번째 수 
의 3 과 일치되여야 한다. 이렇게 하면 두 지수부들이 갈아 지며 바로 이것이 류점수로 
표현되 는 두수를 더할수 있는 수학적 인 필요조건이 다. 결국 웃식 은 다음과 갈다. 

(123 父 10°) + (456 父 10" 2 ) = (123 父 10° ) + (4. 56 父 10°) = 127.56 父 10° 

지수부의 정렬은 보다 작은 수는 오른쪽으로 (2 의 지수부를 증가시킨다.) 보다 큰수 
는 왼쪽으로 밀기하여 진행한다. 이 연산과정 에 수자들이 손실될수 있는데 이 손실은 밀 
기되는 보다 작은 수들에서 생기게 된다. 다시말하여 연산과정에 손실되는 수자들은 상 
대적으로 작은 무게를 가진다. 정렬은 결수부 오른쪽 1 수자의 크기분을 밀거나 두 지수 
부가 갈아 질 때까지 지수부를 증가시켜 진행한다(밑수가 16 인 경우 한 자리의 밀기는 
4 bit 의 밀기와 갈다.). 이 정렬처리과정에 곁수부가 0 이 되면 그때에는 다른 수가 결과 
로 된다. 결국 두수가 무게적으로 서로 차이나는 지수부를 가지는 경우에는 보다 작은 
수가 손실된다. 

다음에 는 두수의 곁 수부부호를 고려하여 결수부들이 서 로 더해 진 다. 부호가 서 로 
다르면 결과는 0 일수 있다. 또한 한 자리의 곁수부자리넘침이 생길수도 있다. 곁수부자 
리넘침이 생기면 곁수부결과가 오른쪽으로 밀리므로 지수부를 증가시킨다. 이때 지수부 
자리넘침이 일어 날수 있으며 이것이 체계에 보고되고 연산은 중지된다. 

다음단계는 결과를 정규화하는 단계 이 다. 정규화는 맨 웃자리 (밑수16의 지수부인 경 
우 4 bit ) 가 령 이 되 지 않을 때 까지 곁수부를 왼쪽으로 밀 어서 진행한다. 밀 때 마다 지수 
부가 감소하며 이 렇게 되면 지수부아래 자리넘침를 일으킬수 있다. 최종적 으로 결과는 둥그 
리기 되 여 기 록된 다. 둥그리 기 에 대 한 론의는 곱하기 와 나누기 를 고찰한후에 하기 로 한다. 

2. 급하기와 나누기 

류점수의 곱하기와 나누기는 더하기와 덜기보다 훨씬 더 간단하다. 

우선 그림 8-23 에 기초하여 곱하기를 먼저 고찰하자. 곱하기 에서는 연산수가 0 이면 
0 이 결과로 기록된다. 다음단계는 지수부를 더하는것이 다. 지수부가 편위형식으로 기억 
되면 지수부합은 편위를 2배한것으로 된다. 따라서 편위값을 합에서 덜어 야 한다. 이 결 
과는 알고리듬을 끝내면서 나타나군 하는 지수부자리넘침 이 나 지수부아래자리넘침을 일 
으킬수 있다. 

다음단계 는 적의 지수부가 알맞는 범위내 에 있게 되 면 두수의 부호를 고려하여 결수 
부를 곱하는것이다. 곱하기는 옹근수곱하기와 갈은 방법으로 수행된다. 이 경우에 여기서 
는 부호-크기표현로 처리하고 있다. 그러나 내용적으로는 2 의 보수표현에서의 곱하기와 
류사하다. 곱하기의 적은 곱하는수와 곱해지는수의 길이를 두배한 길이로 될것이다. 범위 
를 벗어 나는 비트들은 둥그리기하면서 없어 진다. 

적 을 계산한 다음에 는 그 결과를 더 하기 와 덜기 에서처 럼 정 규화하여 둥그리 기한다. 
정규화에서는 지수부아래자리넘침이 일어 날수도 있다. 
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斗. 나누어 지 는수가 0 이면 결과는 0 이 다. 다음단계 에 서 는 
각 지수부를 던다. 이것은 뒤에서 더해 질 편위를 제거한 C 
사 나 지수부자리 넘침 이 발생 하였는가를 검사한다. 
현단계에서는 결수부를 나누며 이때 보통 정규화와 둥그리 

정확도고찰 

시비트 

에서 류점수연산을 하기에 앞서 연산수의 지수부와 곁수부 
것을 언급하였다. 곁수부의 경우에 그 등록기의 길이는。 
인 비트를 더 한 길이보다 언제 나 더 크다. 이 등록기는 감 






x = 1.000.00 X2 1 

= 0.111 . 11X2 1 

T" = 0.000.01 X2 1 

= 1.000.00 X2" 22 


x = 1.000.00 0000 X2 1 

-y = 0.111 . 11 1000 X2 1 

z = 0.000.00 1000 X2 1 

= 1.000.00 0000 X2 -23 




x = . 100000 X16 1 
-y = . OFFFFF x 16 1 
T = . 000001X16 1 
= . 100000 X16 -4 

t) 


x = . 100000 00X16 1 
-y = .OFFFFF F0X16 1 
T" = .000001 ― 10X16 1 

= .100000 00X16' 5 

a) 


그림 8-25. 감시비 트들의 리 용 

-1- 감시비트가 없는 2 진수실례， 1-- 감시비트가 있는 2진수실례， 
n- 감시비 트가 없는 16 진수실 례 #:. «- 감시비 트가 있는 16 진수실 례 


이 와 같은 둥그리 기 를 위한 여 러 가지 방법 들이 이 미 개 발되 여 리용되 고 있 다. IEEE 
에서도 다음과 갈은 4 가지 방법들을 표준으로 건의 하고 있다. 

• 가장 가까운 수로 둥그러기 : 결과를 표현할수 있는 가장 가까운 수로 둥그리기한다. 

• + O 0 방향으로 둥그리기 : 결과를 ,和방향으로 둥그리기 한다. 

• _oo 방향으로 둥그리 기 : 결 과를 _ 00 방향으로 둥그리 기 한다. 

• 0 으로 둥그러 기 : 결 과를 0으로 둥그리 기한다. 

이 규칙 들을 차례 로 고찰해 보자. 가장 가까운 수로 둥그리 기 는 IEEE 표준에 서 암시 
적 인 둥그리 기방식 으로써 다음과 같이 둥그리 기 를 하면 정 확한 값에 매 우 가깝게 된 다. 
두개 의 가장 가깝게 표현 할수 있는 값들이 고르롭게 있 다면 그중에 서 맨 아래 자리 비 트가 
0 인 수로 둥그리 기 를 한다. 

실례로 기 억해 야 할 23 개의 비트밖으로 벗어 나는 초과비트들이 10010 인 경우 초과 
비트들은 그 합이 마지막표현비트자리의 절반이상으로 된다. 이 경우에 정확한 답은 다 
음 표현수에 로 올리 둥그리 기 를 하여 마지 막표현비 트에 2진수 1을 더 한것 이 다. 초과비 트 
들이 01111 인 경우는 초과비트들이 마지막표현비트자리의 절반보다 작게 된다. 이때 그 
의 정확한 답은 초과비트들을 간단히 잘라 버린것으로써 이것은 다음표현수에 내리둥그 
리기 영향을 미친다. IEEE 표준은 1000 … 형식의 특수한 초과비트들에 대해서도 규정 하고 
있다. 이 경우 결과는 명확히 두 가능한 표현값들의 중간정도로 된다. 

이 렇게 엄 어 진 결과에서 초과비트들을 잘라 버리는것은 가장 간단한 둥그리 기연산 
방법 이다. 그러나 이 간단한 방법에도 계산이 진행됨에 따라 작기는 하지만 잘라 버린 
량이 루적되는 현상이 나타난다. 

이것을 해결하기 위한 한가지 방법은 우연수에 기초하여 올리 혹은 내 리둥그리기를 
하는것인데 이렇게 하면 평균적으로 결과가 한쪽으로만 치우치지 않게 된다. 이 방법의 
결함은 예 측할수 없으며 또한 확정적 인 결과를 얻지 못한다는것 이 다. 보통 IEEE 에서 표 
준화된 방법들은 결과를 평 탄하게 한다. 즉 계산결과가 정 확히 두 표현수들사이 중간값 
이면 마지막표현비트가 1 인 경우에 올리둥그리기되며 0 인 경우는 내리둥그리기된다. 

.‘‘ '작々幻 및 一 00 방향으로 둥 그러기는 구간산수에 기초하고 있는 방법이다. 구간산수는 
모든 결과가 두개의 값을 주므로 류점수계산에서 오유를 감시 하거 나 조종하는 효과적 인 
방법으로 리용할수 있다. 구간산수에서 결과로 되는 두값은 실지값을 포함한 구간의 아 
래끝점과 웃끝점에 해당한다. 구간의 너비는 웃끝점과 아래끝점사이의 차로서 바로 이것 
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이 둥그리기결과의 정확성을 표현한다. 구간의 끝점들을 표현할수 없는 경우에는 구간끝 
점들을 특별히 내리 및 올리둥그리기한다. 구간의 너비는 그 실현에 따라 각이하지만 알 
고리듬은 좁은 구간너비가 엄어 지도록 설계되여 있다. 웃한계와 아래한계사이 범위가 
매우 좁은 경우에는 아주 정확한 결과가 엄어 진다. 그렇지 못한 경우 즉 구간너비가 좁 
지 못한 경우에는 이 내용을 알고 추가적인 해석을 해야 한다. 

IEEE 표준에서 규정된 마지 막둥그리기 방법은 0 으로 둥그리기 하는것 이 다. 이것은 사 
실상 단순한 잘라버 리 기연산이다. 즉 초과비 트들을 무시하는 방법 이 다. 이 방법은 어느 
정도 단순한 범 법 으로 보이지만 잘라 버 린 값의 크기 가 늘 정 확한 원래값보다 작거 나 같 
아 지도록 연산에서 0방향으로 약간 치우치게 결과를 얻어야 한다. 이것은 령 이 아닌 초 
과비 트들이 있는 모든 연산에 영 향을 주므로 이 미 고찰한 둥그리 기방법 들보다는 더 큰 
편의를 가질수 있다. 

4. 旧 EE 에서 표준화된 2 진류점수연산 

IEEE 754 는 류점수산수연산이 하드웨 어가동환경 과는 관계 없이 같은 형 식이면서도 
예측할수 있는 결과를 줄수 있도록 실지 프로그람이나 수속의 바탕으로 되는 간단한 수 
의 형식만이 아니라 복잡한 수의 형식에 대하여서도 정의하고 있다. 

이미 앞에서 고찰한 둥그리기가 바로 여기에 속한다. 이 절에서는 둥그리기를 제외 
한 다른 세 가지 대 상들 즉 무한대 , NaN 와 비 정 규화된 수들을 고찰한다. 

무한대 

무한대산수연산은 실지 산수연산의 극한 경 우로 취 급되 며 모든 수들은 무한대값들 
사이에 있다. 


—政 < (모든 유한인 수) < 

일부 특수한 경우를 제외하고 무한대가 들어 가는 임의의 산수연산은 명백한 결과를 
낳는다. 실례를 들면 다음과 같다. 


5 + (+oo) = + oo 
5 一 (+oo) =-oo 
5 + (一 oo) =-oo 
5 一 (-oo) = + oo 
5 X (+oo) =+oo 


5 +(+ 0 。) =+oo 
(+oo) + (+oo) =- 
(_oo) + ( - oo) =-cx 
(—oo) —(+oo) =- 
(+oo)-(-oo) =+oo 


정적 및 신호화 NaN 

NaN 은 류점수형식으로 부호화된 기호실체로써 여기에는 신호화 (signaling) 및 정적 
(quiet)NaN 의 두가지 형이 있다. 신호화 NaN 은 그것이 연산수로 나타날 때에는 반드 
시 무효연산례외 임을 알린다. 신호화 NaN 은 초기화되지 않은 변수들에 값을 주며 표준 
화되 지 않은 산수연산을 강화하는데 리 용된다. 정 적 NaN 은 례 외 (Exception) 를 신호함이 
없 이 거 의 모든 산수연산을 진행 할수 있게 한다. 표 8-6 은 정 적 NaN 을 만드는 연산을 
보여 주고 있다. 

이 두가지 형의 NaN 은 같은 형식 즉 모두 1 인 지수부와 령이 아닌 결수부를 가진 
다. 령이 아닌 곁수부의 실지 비트렬은 실현독립이다. 이 결수부값에 의하여 신호화 NaN 
와 정적 NaN 을 구별하며 또 알맞는 례외조건을 규정할수도 있다. 
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수와 그다음 보다 큰 수사이의 간격보다 훨씬 더 넓어 진다. 점차적인 아래자리넘침은 
이 간격을 채워 줌으로써 정규화된 수들의 둥그리기와 비교될수 있을 정도로 지수부아래 
자리넘침의 영향을 줄인다. 


참고문헌과 Web 싸이트 


를퓨터연산을 배우려는 열성독자들에게는 [ SWAR 9()] 의 전 2 권으로 된 책이 좋다. 
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알아야 하는가》라는 제목으로 된 [ GOLD 91] 이다. [ WALL 90] 은 이 내용을 보다 고급 
하게 취급하고 있으며 [ KNUT 98] 은 이에 대한 가장 우수한 책으로서 옹근수연산도 취 
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IEEE 754： 이 Web 싸이 트는 IEEE 754 문서，관련된 출판물들과 
론문들 그리고 를퓨터산수연산과 관련된 기 타 쓸모 있는 관련정 
보들을 제공한다. 
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련습문제 

1. 2 진옹근수표현에 많이 리용되고 있는 표현법중의 하나는 1 의 보수표현법이다. 이 
표현법에서 정의 옹근수는 부호-크기표현법과 갈은 방법으로 표현된다. 부의 옹근 
수는 대 응하는 정수의 매 비트에 대 하여 불보수를 취 하여 표현한다. 

1. 식 8-1 과 식 8-2 와 류사하게 비 트들의 무게합을 리용하여 1 의 보수를 정 
의 하시 오. 

L . 1의 보수로 표현할수 있는 수들의 범위는 얼마인가? 
n . 1의 보수연산에서 더하기알고리듬을 정의하시오. 

2. 표 8-1 에 부호-크기표현법과 1의 보수표현법에 대한 렬을 추가하고 전개하시오. 

3. 2 진단어에 대 한 다음의 연산을 고찰해 보자. 연산은 맨 아래 자리비 트부터 시 작한 
다.첫 비 트가 도착하여 복사될 때 까지 0 인 모든 비 트들을 복사하시 오.그다음 매 
비트의 보수를 취하면 결과는 어떻게 되겠는가? 

4. 제 3 절에서 2 의 보수연산을 다음과 같이 정의 하였다. 표 의 2 의 보수를 구하자면 X 
의 매 비트의 불보수를 취 하고 거기 에 1을 더한다. 

- T . 다음내 용이 2의 보수연산에 대 한 등가적 인 정 의 라는것 을 말해 보시 오. 

n 비 트의 옹근수 표 에 대 하여 그의 2 의 보수는 부호 없는 옹근수로써 X 를 취 
하고 (2 n_ X) 를 계산하여 엄는다. 

그림 8-2 가 자에서의 요구를 그라프적으로 볼수 있도록 해준다는것을 론증하 
시오. 이때 시계 바늘방향에 로의 이동이 어떻게 덜기연산으로 되는가를 보여 
주시오. 

5. 다음의 2 의 보수연산에 서 차이 점 을 찾으시 오. 

ᄀ . 111000 L. 11001100 n. 111100001111 기 . 11000011 
-110011 -101110 -110011110011 -11101000 

6. 아래의 내용이 2 의 보수연산에서 자리넘침에 대한 타당성이 있는 대리정의로 되 
는가를 말하시 오. 제 일 왼쪽에 있는 렬의 안쪽과 바깥쪽으로의 자리내 림 혹은 자 
리 올림 비 트들의 안맞음론리더 하기 가 1 이 면 자리넘 침 조건 이 만족되 며 그렇 지 않으 
면 자리넘침이 생기지 않는다 . 

7. 그림 8-9 와 그림 8-12 를 비 교하시 오 . C 비트는 그림 8-12 에서 왜 리 용되지 않는 
가? 

8. 2 의 보수로 표현된 X 와 Y 의 값이 각각 다음과 같이 주어 졌을 때 부스알고리듬 
으로 적 P = XXY 를 계 산하시 요. 

X = 0101 (X = 5) 

Y = 1010 (Y =_6) 

9. 밑수가 B 인 2 개의 n- 자리수들의 곱하기는 2n- 자리수보다는 크지 않은 적을 가진 
다는것을 증명하시오. 

10. 그림 8-16 의 부호 없는 2 진수나누기알고리 듬의 타당성 을 그림 8-15 에 서 보여 준 
나누기연산단계 들로 확증하시 오. 
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11. 제 3 절에서 서술한 2 의 보수옹근수의 나누기알고리 듬은 뒤 따르는 비성공덜기연산 
이 A 등록기 에 서 의 값을 회 복해 야 하므로 회 복방법 으로 알려 져 있 다. 이 방법보 
다 약간 더 복잡한 방법 인 비회 복방법 은 불필요한 덜기 및 더 하기연산을 하지 않 
는다. 이 방법 에 대 한 알고리 듬을 제 기하시 오. 

12. 를퓨터의 옹근수연산에서 두 옹근수 J 와 K 의 상 J/K 는 보통 상보다 작거나 같다. 
이것이 사실인가? 

13. 12 bit 의 단어 를 리 용하는 2 진 2 의 보수표기 로 표현된 수 -145 를 그와 같은 형 식 
의 13으로 나누시오. 이때 제 3절에서 서술한 알고리듬을 리용하시오. 

14. 지수부 e 는 q 의 편위를 가지고 9ᄂ료범위 에 놓이며 밑수는 건 이고 결수부의 
길이가 p 자리 라고 하자. 

ᄀ . 프로그람작성에 리용될수 있는 가장 크거나 가장 작은 정수값은 얼마인가? 

T -. 정규화된 류점수로 쓸수 있는 가장 크거나 작은 정수값은 얼마인가? 

15. IEEE 32 bit 류점 수형 식 으로 다음수들을 표현 하시 오. 

ᄀ .- 5 仁 .- 1.5 n . 1/16 

ᄂ . -6 근 . 384 ᄇ. -1/32 

16. 밑 수가 16 이 고 지 수부가 7 bit 인 IBM 의 32 bit 류점 수형 식 으로 다음수들을 표현하 
시오. 


1 . 1.0 

仁 . 1/64 

n . -15.0 

a. 7.2 x 10 75 

L . 0.5 

0.0 

H . 5.4 x 10" 79 



17. 다음의 경우에 편위값은 얼마인가? 

1 . 밑 수 2， 6 bit 마당의 지 수부 

l . 밑 수 8， 7 bit 마당의 지 수부 

18. 그림 8-21 u 의 류점수형식 에 대 하여 그림 8-19 l 와 류사한 수축을 그리시오. 

19. 8 bit 의 편위 형 지 수부와 23 bit 의 곁 수부를 가진 류점 수형 식 이 있 다. 다음의 수들에 
대한 비트렬을 이 형식으로 보여 주시오. 

1. -720 
l . 0.645 

20. 일반적으로 류점수연산의 비정확성을 말할 때에는 거의 같은 량의 덜기에서 소거 
(cancellation) 로 인하여 생기는 오유를 념 두에 둔다. 그러나 X 와 Y 가 근사적으로 
같을 때 에는 차 X-Y 가 오유가 없이 정 확히 엄 어 진다. 이 말은 실지 로 무엇을 의 
미 하는가? 

21. 콤퓨터에서 리용한 임의의 류점수표현은 어떤 실수만을 정확히 표현할수 있다. 즉 
실수를 제외한 다른 모든 수들은 근사적 으로 표현된다. 서 가 실제값 A 의 근사값 

이 라고 하면 그때 상대오차 r 는 다음과 같이 표현된다. 

A - A ' 

r =- 

A 

다음의 10 진수 + 0.4 를 밑수=2, 지수부는 4 bit (편위 방식 )이 고 결수부는 7 bit 인 
류점 수형 식 으로 표현하시 오. 그리 고 상대 오차를 구하시 오.， 

22. 수값 A 와 B 가 근사값 A '， B ' 로 콤퓨터 에 기 억된다. 임의의 잘라버 리 기 혹은 둥 
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그리기오유를 무시하고 이 두수의 적의 상대오차가 근사적으로 개별적인 수들에 
서의 상대오차들의 합으로 된다는것을 증명 하시오. 

23. A = 1.427 일 때 잘라 버리는 방법으로 A 를 1.42 로 둥그리기한 경우와 A 를 1.43 
으로 둥그리 기한 경 우의 상대 오차를 각각 구하시 오. 

24. 콤퓨터계산에서 생기는 가장 심각한 오유들중의 하나는 두개의 서 로 비숫한 수들 
이 덜 어 질 때 생 긴다. A = 0.22288 과 B = 0.22211 인 경 우 이 문제 를 고찰하시 
오. 를퓨터 는 소수점아래 다섯 번째 자리 부터 잘라 버 린 다고 가정한다. 

결국 a ， = 0,2228 이고 B ， = 0.2221 이 다. 

1. A / 와 B ' 에 대 한 상대 오차는 얼 마인가? 

C '= A ' - B ' 에 대한 상대오차는 얼마인가? 

25. 다음과 같은 류점수더하기가 어떻게 수행되는가를 보여 주시오(여기서 곁수부는 
소수점아래 4 자리 까지 로 본다. ) . 

1. 0.5566 x 10 3 + 0.7777 x 10 3 
ᄂ . 0.3344 x 10 2 -0.8877 x 10 1 

26. 다음과 갈은 류점 수덜 기 가 어 떻 게 수행 되 는가를 보여 주시 오 (여 기 서 곁 수부는 소 
수점아래 4자리 까지 로 본다. ) . 

0.7744X10- 2 -0.6666X10- 2 
U 0.8844X10 -2 -0.2233x10° 

27. 다음의 류점수계산이 어떻게 수행되는가를 보여 주시오(여기서 결수부는 소수점아 
래 4 자리 까지 로 본다. ) . 

ᄀ . 0.2255xl0 2 x 0.1234x10* 

U 0.8833xl0 3 + 0.5555xl0 5 

28. 다음의 8진수를 16진수로 표현하시 오. 

-1- 12, ᄂ 一 5655, n- 2550276, 근 一 7654336, ᄆ- 3726755 

29. 최종적으로 2 진표현을 가지는 모든 실수 (2 진소수점의 오른쪽에 유한개의 수자# 
을 가짐)들은 역시 최종적인 10진표현 (10 진소수점의 오른쪽에 유한개의 수자들을 
가짐)을 가진다는것을 증명하시오. 

부록 8. 수체계 


1. 10진수체계 

일 상생 활에 서 는 수를 표현 하기 위하여 10 진수 (0，1，2,3,4,5,6,7,8, 9) 에 기 초한 수체 
계 를 리 용하고 있는데 바로 이 수체계 를 10 진수체 계 라고 한다. 이제 10 진수 83 이 무엇 
을 의 미 하는가를 보기 로 하자. 83은 8개의 10 과 3 을 더 한것을 의 미한다. 


83 = (8 X 10) + 3 
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수 4728은 4개의 1000,7개의 100,2개의 10 그리고 8을 모두 더한것을 의미한다. 


4728 = (4 X 1000) + (7 X 100) + (2 X 10) + 8 

10 진수체계는 밑수 10 을 가진다고 말할수 있다. 이것은 10 진수에서 매 수자가 그 수자 
의 자리 에 따라 지 수가 붙은 10을 곱한다는것 을 의 미한다. 례 를 들면 다음과 같다. 

83 = (8 X 10 1 ) +(3 X 10°) 

4728 = (4 10 3 ) + (7 x 10 2 ) + (2 x 10 1 ) + (8 X 10°) 

소수값은 다음과 갈은 형식 으로 표현한다. 

472.83 = (4 X 10 2 ) + (7 X 10 1 ) + (2 X 10°) + (8 父 10" 1 ) +(3 10一 2 ) 

일반적으로 X ={...x 2 x 1 x Q ...x_ 1 x_ 2 x_ 3 ...；hl 10 진수표현에서 표 의 값은 다음과 같 
이 표현된다. 

X 수， 

2 . 2 진수체계 

10진수체계에서는 10개의 서로 다른 수자들이 밑수 10으로 수들을 표현하는데 리용 
된다. 2 진수체 계는 2개의 수자 1 과 0 만을 가진다. 따라서 2 진수체계 에서 수들은 밑수 2 
로 표현된다. 

혼돈이 없 이 정 확히 구별 하기 위하여 때 로는 그 수의 밑 수를 첨 자로 써 주기 도 한다. 
실례 로 83 10 과 4728 10 은 10 진수표기 로 표현된 수 혹은 간단히 10 진수들이 다. 2 진수표기 
에서 수자 1 과 0 은 10 진수표기에서와 같은 의미를 가진다 . 

0 2 = 0 10 
h = lio 

10 진수표기 에 서 와 같이 보다 큰 수를 표현 하기 위하여 2 진수의 매 수자는 자리 에 
따라 서 로 다른 값을 가진다. 


10 2 =(lx2 1 ) + (Ox2°) = 2 10 
11 2 =(1x2 1 ) + (1x2 0 ) = 3 10 
100 2 =(1x2 2 ) + (Ox2 1 ) + (Ox2°) = 4 10 

소수값인 경 우에 는 소수점아래값이 부의 제 곱으로 표현된다. 

1001.101 = 2 3 +2°+2 _1 +2 _3 = 9.625 10 

3. 2진수와 10진수사이 변환 

2진수를 10진수로 바꾸는것은 간단하다. 이미 앞에서 이와 관련한 여 러 가지 실례들 
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을 보았다. 2 진수를 10 진수로 바꾸자면 매 2 진수자리 에 알맞는 제 곱의 2 을 곱하고 그것 
들을 모두 더하면 된 다. 

10 진수를 2 진수로 바끌 때에는 옹근수부와 소수부를 따로따로 취급해 야 한다. 이제 
10 진수옹근수 N 을 2 진수로 바꾸는 경우를 고찰해 보자. 10 진수 V 을 2 로 나누어 상 Ni 
과 나머 지 따이 얻 어 진 다고 하면 다음과 같이 쓸수 있 다. 

N = 2 xN 1 + R 1 兄=0 혹은 1 


다음에 상 的을 또 2 로 나눈다. 이때 새로운 상과 나머지를 각각 N 2 , 穴 2 이 라고 하면 다 
음과 같이 표현된다. 


결국 


Nj =2 xN 2 + R 2 R 2 =0 혹은 1 

N =2(2 N 2 + 及 2 ) + R 1 =2 2 N 2 + 及 2 x 2 1 X 兄 x 2 0 


마찬가지 로 상 N 2 이 N 2 =2 N 3 + R 3 - 로 된 다면 尺 은 다음과 같이 표현된 다. 


N =2 3 N 3 + R 3 x 2 2 + R 2 X 2 1 % Ri 然 2° 


N > fh > N 2 °\ 뜨로 이 과정를 반복하면 결과적으로 상 Mc = l 과 0 혹은 1로 되는 나머지 R k 
가 나올것 이 다 (10 진옹근수 0, 1 이 2 진옹근수 0, 1 과 등가이므로 이것은 제외시 킨다.). 


N = (1 次 2 k ) + ( R k x 2 i_1 ) + … +( R 3 公 2 2 ) + (及 2 x 2 1 ) + ( i ? 1 X 2°) 


결국 2 에 의한 나누기를 반복함으로써 밑수가 10 인 수를 밑수가 2 인 수로 바꾼다. 이 렇 
게 하여 상이 0 이 될 때 까지 나머지는 무게 가 증가하는 순서 로 10 진옹근수 N 의 2 진수 
가 표현된다. 이 상의 실례 들을 그림 8-27 에 보여 주었 다 
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다음으로 소수부는 그림 8-28 에서 보여 준바와 같이 2 에 의한 반복곱하기로 얻어 
진다. 매 단계 에서 10 진수의 소수부에는 2가 곱해 진다. 2의 곱하기결과로 생 긴 적 에서 
10 진소수점의 왼쪽에 있는 수자는 0 혹은 1 이며 이것이 2 진수를 표현한다. 이 표현은 
가장 무게가 큰 비트로부터 출발한다. 적의 소수부는 다음단계에서 곱해지는수로 리용된 
다. 이것 이 정 확한가를 보기 위하여 이제 정의 10 진소수점 F <1 을 생각하자. 표 는 다음과 
같이 표현할수 있다. 


F = [«- 1 4 J + 卜 X ^]+ 卜 냥：卜… 

여 기서 매 a-i 는 0 혹은 1 이 다. 웃식의 량변에 2를 곱하면 다음과 같이 된다. 

두 표현식에서 옹근수부는 갈아야 한다. 2, 의 옹근수부는 0< F <1 이므로 0혹은 1이여야 
하며 결국 이 값은 간단히 a - i 이다. 따라서 2,를 다음과 같이 쓸수 있다. 

Fi=(a. 2 x^)+L. 3 x^ 


a _2 을 구하기 위하여 이 처리를 반복해 보자. 그러면 이 처리가 정확치 못하다는것을 알 

수 있다. 자리수가 유한인 10 진소수가 
자리수가 무한인 2 진소수가 될수 있다. 
이와 같은 경우에 보통 변환알고리듬은 
요구하는 정 확성 에 따라 이미 규정된 
수의 단계 를 벗 어 나면 변 환을 중지한 
다. 


0.24 x 2= 0.48 



그림 8 - 28 . 소수로 된 10 진표기 를 2 진표기 로 
바꾸는 실례 

ᄀ -0. 81 10 =0.110011 2 (근사값 )， l -0. 25 10 =0.01 2 
(정확한 값) 


4. 16진수표기 

수자형콤퓨터구성 요소들은 고유한 
2 진속성을 가지므로 콤퓨터들에서 모 
든 형의 자료는 여러가지 2 진부호로 
표현된다. 본문에서 의 2진부호와 옹근 
수의 2 진표기에 대 한 실례들은 이미 
앞에서 보았다. 앞으로 다른 형의 자 
료에 2 진부호를 리용한 실 례 들을 더 
고찰하겠다. 2 진수체계는 콤퓨터에서 
는 매우 쓰기 편리하지만 인간에게는 
매우 시끄러운것으로 되고 있다. 그리 
하여 콤퓨터 로 일하는 대 다수 콤퓨터 
전 문가들은 보다 함축된 표기 를 리용 
하고 있다. 
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그들이 과연 어 떤 표기 를 리 용하는가? 그중의 하나가 바로 10진표기 이 다. 이 표기 는 
2 진표기보다 어느 정도 함축된 표기 이지만 밑수 2 와 밑수 10 사이의 변환이 오랜것으로 
하여 쓰기 불편하다. 

그리하여 10진표기 대 신 16진표기를 쓴다. 16진표기 에서 는 우선 2진수자들이 4개씩 
묶어 진다. 이 렇게 묶어 진 4개의 2 진수자들의 가능한 조합에 다음과 같이 기호를 불인 
다. 


0001 = 1 

1001 = 9 

0010 = 2 

1010 = A 

0011 =3 

1011 =B 

0100 = 4 

1100 =C 

0101 =5 

1101 =D 

0110 =6 

1110 =E 

0111 =7 

1111 =F 


16 개의 기 호가 리용되므로 이 표기를 16 진표기 라고 하며 16 개의 기 호를 16 진수자라고 
한다. 

16 진수자렬은 밑수 16 을 리용하여 10 진옹근수로 표현할수 있다. 례를 들면 다음과 
같다. 

= (1 10 x 16 1 ) + ( A 10 x 16°) = 26 

16 진표기 는 밑 수 16을 가진 옹근수를 표현하는데 만 리 용되 는것 이 아니 다. 이 표기 는 본 
문，수 그리고 다른 형의 자료표현에도 리용하며 또 이 러한 16 진표기들에서 임의의 2진 
수자렬을 간결 하게 표현하는데 도 리 용된다. 16진표기 를 쓰는 리 유는 다음과 같다. 

1. 2진표기보다 더 함축된다. 

2. 대 다수 콤퓨터 에서 2 진자료는 4 bit 의 배수로 되며 따라서 단일 16 진수자의 배 
수로 된다. 

3. 2진표기 와 16진표기 사이 변환이 매 우 쉽다. 

2진표기와 16진표기사이 변환과 관련한 실례로써 2진수렬 110111100001을 고찰하면 
다음과 같다. 


1101 1110 0001 = DElie 

DEI 

숙련된 프로그람작성 자인 경우 종이 장우에 써 보지 않고도 2 진자료를 등가적 인 16 진 
수로 변환할수 있다. 이를 위 한 숙련은 필요 없지만 독자들이 16진표기와 부닥칠수도 있 
으므로 이 론의를 본문에서 취급한다. 
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제 9 장. 명령모임: 특성과 기능 


큰글주소배치 


11 

12 

13 

14 





00 

01 

02 

03 

04 

05 

06 

07 

21 

22 

23 

24 

25 

26 

27 

28 

08 

09 

0 A 

OB 

OC 

0 D 

0 E 

OF 

31 

32 

33 

34 

’A’ 

’B ， 

， C ， 

卜 D’ 

10 

11 

12 

13 

14： 

15 ! 

! 16 

； 17 

， E ， 

!■「 

Fg " 


51 

52 



18 

1 19 

； 1 A 

IB 

1 C 

ID 

IE 

IF 

61 

62 

63 

64 





20 

21 

22 

23 






♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦ 

♦ 를퓨터명령의 본질적요소에는 수행되는 연산을 규정하는 조작 코드， 연산의 입력 및 
출력을 지정하는 원천 및 목적연산수참조，늘 암시적 인 다음명 령 참조 등이 있다. 

♦ 조작코드는 일반적인 연산종류들가운데서 어느 한 연산을 규정한다. 연산종류에는 
산수-론리연산，두 등록기사이나 등록기와 기억기사이 혹은 두 기억기위치들사이 
자료전송，입력/출력과 조종 등이 있다. 

♦ 연산수참조는 연산수자료의 등록기 혹은 기억기위치를 규정한다. 자료의 형은 주소， 
수，문자，론리자료 등 이 다. 

♦ 처 리장치들에서 공통적 인 구조적특징은 탄창을 리용하는것 이 다. 탄창은 프로그람작 
성자가 볼수도 있고 보지 못할수도 있다. 탄창은 틀을 호출하거나 그로부터 돌아 
갈 때 리용하며 또 기억기주소지정에도 리용할수 있다. 기본탄창연산은 PUSH , 
POP 이며 이외에 꼭대기 하나 혹은 두개의 탄창위 치들에 대한 연산도 있다. 탄창은 
대체로 높은 주소에서 시작하여 낮은 주소로 가면서 채워 지도록 실현된다. 

♦ 처 리 장치 들은 기 억 기 에 다중바이 트(여 러 개 의 바이 트)들을 배 치 할 때 바이 트의 배 치 
순서에 따라 큰끝，작은끝，쌍끝처리장치로 분류할수 있다. 가장 낮은 수값주소에 
맨 웃자리바이트가 기억된 여러 바이트수값은 큰끝방식으로 기억된다고 말한다. 가 
장 높은 수값주소에 맨 웃자리바이 트가 기 억되는 경 우는 작은끝방식 이 라고 한다. 
쌍끝처 리장치 는 두 방식 을 다 지 원 할수 있 는 처 리장치 이 다. 

♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦ 

이 책 에서 론의하는 대부분 내 용들은 콤퓨터 사용자나 프로그람작성 자들에 게 는 명 확 
지 않은 점들이 적지 않다. 프로그람작성 자가 Pascal 이 나 Ada 와 같은 고급언어 를 리용 
하는 경우에는 콤퓨터의 근본을 이루는 기본방식의 매우 적은 부분만을 볼수 있다. 
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콤퓨터설계 가나 콤퓨터 프로그람작성 자가 콤퓨터를 조사할수 있는 하나의 경계분 
야는 기계명 령모임 이 다. 설계 가의 립장에서 보면 를퓨터 기계명 령모임은 CPU 의 기능 
적 인 요구를 보장하여 준다. CPU 를 동작시키는것은 크게 보면 기계명 령모임의 집 행 
을 동반하는 과제 이 다. 사용자의 견지에서 보면 사용자가 기계어 (실지로는 아쌤불리 
언어，제 6 절 참고)로 프로그람을 작성할수 있게 한다. 다시말하여 사용자가 등록기 
와 기 억기구조，를퓨터 가 직 접 지원하는 자료의 형 , ALU 의 기능 등을 알고 프로그 
탐을 작성할수 있게 한다. 

콤퓨터의 기계 명 령 모임 에 대 한 서술에서 는 콤퓨터의 CPU 를 설명하는데 많은 몫을 
돌려 졌 다. 이 장과 다음장에 서 는 먼저 기 계 명 령 에 기 본중점 을 두고 그다음에 는 CPU 의 
구조와 기능을 고찰한다. 


제 1 절. 기계명령의 특성 

CPU 의 동작(연산)은 그것 이 실 행 하는 기 계 명 령 혹은 콤퓨터 명 령 이 라고 하는 명 령 
들에 의하여 결정된다. CPU 가 실행할수 있는 각이한 명령들의 모임을 CPU 명령모임이 
라고 한다. 

1. 기계명령의 요소 

모든 명 령은 그것 이 CPU 에 의하여 실행되므로 CPU 에서 요구하는 정 보를 포함하 
고 있어 야 한다. 그림 3-6 을 되풀이한 그림 9-1 은 명 령 실행 에서의 단계를 명 확히 보여 
주고 있으며 또 기계명령의 요소들을 정의하고 있다. 



기계명령의 요소들은 다음과 같다. 

• 조작코드: 수행 되 는 연산을 규정한다. 더 하기，입 력 /출력 과 갈은 연산종류를 규 
정한다. 연산은 조작 코드라고 하는 2진부호로 규정된다. 

• 원시연산수참조: 연산에는 하나 혹은 그이상의 원천연산수들이 참가한다. 이 연 
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산수는 연산에서 입구로 되는 연산수이 다. 

• 결과연산수참조: 연산은 결과를 낳는다. 

• 다음명 령참조: 이것은 명 령실행 이 완료된후에 CPU 가 다음명 령을 불러 내도록 
한다. 

불러 들인 다음명령은 주기억기에 들어 가며 가상기억기체계인 경우에는 주기억기 
혹은 외부기 억기 (디스크)에 들어 간다. 대부분 경우에 불러 들인 다음명 령은 현재명 령 이 
집행된 다음 즉시 실행된다. 명시적인 참조를 하자면 주기억기 혹은 가상기억기주소가 
지정되여 야 한다. 주소가 지정되는 형식은 제 10 장에서 고찰한다. 

원천 및 결과연산수들은 다음의 세가지 령역중 어느 하나에 있을수 있다. 

• 주기억기 혹은 가상기억기: 다음명령참조에서와 같이 주기억기 및 가상기억기의 
주소가 지정되여야 한다. 

• CPU 등록기 : 특별한 경우를 제외하고 CPU 는 기계명령에 의해 참조되는 하나 혹 
은 그이상의 등록기들을 가지고 있다. 한개의 등록기만 있는 경우 그에 대한 참조 
는 암시적 이다. 등록기가 하나이상 있는 경우에는 매 등록기에 유일번호가 할당되 
며 따라서 명령은 자기가 요구하는 등록기의 번호를 가지고 있어야 한다. 

• 입출력장치: 명령은 연산을 위하여 입력/출력 (I 八))모둘이나 장치를 규정할수 있 
어 야 한다. 기 억기배 치식 I/O 를 리용하는 경우 이것은 주기억기 혹은 가상기 억 
기의 주소로 된다. 

2. 명령표현 

콤퓨터에서 모든 명령은 비트렬로 표현된다. 명령은 그 명령의 성분요소들에 대응하 
는 마당으로 분할된다. 명 령형식의 간단한 실례를 그림 9-2 에 보여 주었다. 다른 하나의 
실례 인 IAS 명 령형식은 이미 그림 2-2 에서 보았다. 보통 대 다수 명 령모임 에서는 한가지 
이상의 형식이 리용된다. 명령은 실행되는 동안 CPU 에 있는 명령등록기 ( IR ) 에 보존된 
다. CPU 는 이 등록기에 있는 여 러 마당으로부터 자료를 꺼내여 필요한 연산을 수행할 
수 있다. 

4 bit 6 bit 6 bit 

[ 조작크드 | 연산수참조 ■ 연산수참조 ~]\ 


- IQ bit - 

그림 9-2. 간단한 명령형식 


이 책을 읽는 프로그람작성자들이나 독자들은 기계명령의 2 진표현을 다루기가 힘들 
수 있다. 그리하여 기계명 령의 기 호표현을 리용하는것 이 공통적 인 추세，실천으로 되 였다. 
그 실례 가 바로 표 2-1 에서 고찰한 IAS 명 령 모임 이 다. 

일반적으로 조작코드는 명령략어 ( mnemonics ) 로 표현되며 이것은 연산을 가리 킨다. 
실례를 몇가지 들면 다음과 같다. 


하기 하 
더 덜 고ᄇ 
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DIV 나누기 

LOAD 기억기로부터 자료를 넣기 

STOR 기억기에 자료를 기억 

연산수 역시 기호로 표현된다. 실례로 명령 ADD R , Y 는 등록기 묘의 내용에 자료위 치 
모에 있는 값을 더한다는것을 의미한다. 실례에서 Y 는 기억기위치를 보여 주는 주소이 
며 R 는 특별한 등록기에 해 당한다. 이 연산에서는 기 억기위치의 내용을 더할뿐 그 주소 
에 대한 연산을 하지 않는다. 

이로부터 기계어프로그람을 기호양식으로 표현할수 있다. 모든 기호조작코드는 고정 
된 2 진표현을 가지며 프로그람작성 자는 모든 기 호연산수의 위 치를 규정한다. 실례 로 프 
로그람작성 자는 다음과 갈은 수값정 의 로부터 프로그람을 작성한다. 

X = 513 
Y = 514 

이 단순한 프로그람은 기호입구를 접수하여 그것을 조작코드 및 2 진형태의 연산수참조 
로 바꾸고 2 진기계명 령을 만든다. 

현재 기계 어프로그람작성 자들은 그리 많지 못하다. 오늘날 대부분 프로그람들은 고 
급언어 혹은 아쌤 블리언어 로 작성되는데 여 기서 아쌤 블리언어는 이 장의 마감부분에서 
론의한다. 그러나 기호기계어는 기계명령을 서술하기 위한 쓸모 있는 도구로 남아 있으 
며 이러한 목적을 위해서 앞으로도 계속 리용될것이라고 본다. 

3. 명령의 종류 

BASIC 나 FORTRAN 과 같은 고급언어명 령을 하나 고찰해 보자. 

X = X + Y 

이 명 령 문은 Y 에 기 억된 값을 X 에 기 억된 값에 더 하여 그 결과를 X 에 넣 으라고 콤퓨 
터 에 지시한다. 이것 이 기계명 령 에서는 어떻게 실현되 겠는가? 이것을 보기 위하여 위 치 
513과 514에 대응하는 변수 X 와 Y 를 생각하자. 단순한 기계명 령모임 이 있다고 하면 이 
연산은 세 가지 단순명 령 으로 수행 할수 있 다. 

1. 기 억 기위치 513의 내 용을 등록기 에 넣는다. 

2. 그 등록기 에 기 억 기위치 514의 내 용을 더한다. 

3. 기 억기위치 513에 등록기의 내용을 기 억한다. 

이 실례로부터 알수 있는것은 하나의 BASIC 명령이 3 개의 기계명령을 필요로 할수 
있다는것이다. 이것이 바로 고급언어와 기계어사이의 대표적인 관계이다. 고급언어는 변 
수를 리용하여 간결한 대수양식으로 연산을 표현한다. 기계어는 등록기에로 혹은 등록기 
로부터의 자료전송을 동반하는 기본적 인 양식 으로 연산을 표현한다. 

이 단순한 실례를 가지고 이제 실지 콤퓨터에 반드시 포함되여야 할 명령의 형들을 
고찰해 보자. 를퓨터는 사용자가 임의의 자료처 리과제를 수행할수 있도록 명 령모임을 가 
지 고 있어 야 한다. 이것을 고찰하기 위한 한가지 방도는 고급프로그람작성언어의 능력 을 
고찰하는것 이 다. 고급언어로 작성한 임의의 프로그람은 그것 이 실행되 자면 기계 어로 번 
역되여야 한다. 따라서 기계어명령모임은 고급언어로부터 임의의 명령을 표현할수 있도 
록 충분히 많아야 한다. 이와 같은 견지에서 기계어명령형들을 다음과 같이 나누어 고찰 
할수 있다. 
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그림 9-3. Y=(A—B) 궤 e:+DxE) 집행프로그람 
T- 3 주소명 령， l- 2 주소명 령，[- 1 주소명 령 


이 러한 고찰로부터 하나의 명령은 4개의 주소참조를 포함할수 있다고 볼수 있다. 즉 
2개의 연산수，하나의 결과，다음명 령의 주소 등이 포함될수 있다. 실지로는 4개의 주소 
를 가진 명령이 매우 드물다. 대다수 명령들을 다음명령의 주소가 확정되여 있으므로 하 
나，둘 혹은 세개의 연산수주소만을 가진다. 여 기서 다음명 령주소는 프로그람계수기 로부 
터 얻어 지게 된다. 


SUB Y，A，D 

Y —A-B 

MPY T,D，E 

T^-DXE 

ADD T，T,C 

T —T+C 

DIV Y,Y,T 

Y —Y 수 T 


• 자료처 리 : 산수-론리연산명 령 

• 자료기억: 기억명령 

• 자료전송: I 八)명 령 

• 조종 : 검 사 및 분기명 령 

산수연산명 령 은 수값자료를 처 리 하는 계 산능력 을 제 공한다. 론리명 령 은 수가 아니 라 
단어의 비트들에 대 한 연산을 한다. 이 명 령은 사용자가 쓰고 싶어하는 임의의 다른 형 
의 자료를 처 리할수 있는 가능성 을 준다. 이 연산은 기 본적 으로 CPU 등록기 에 있는 자 
료에 대하여 수행된다. 그러므로 기억기와 등록기사이 자료를 이동하기 위한 기억명령이 
있어야 한다. I 八 D 명령은 기억기에 프로그람이나 자료를 넣어 계산결과를 사용자에게 보 
여 주기 위하여 필요한 명령이다.검사 혹은 시험명령은 자료단어의 값을 검사하거나 혹 
은 계산상태를 검사하는데 리용되는 명령이다. 분기명령은 판정방식에 따라 서로 다른 
명령모임으로 갈라 지는데 리용하는 명령이다. 

앞으로 여러가지 형태의 명령들을 보다 구체적으로 고찰한다. 

4. 주소의 수 

처리장치의 기본방식을 론하는 전통적인 방법들중 한가지 방법은 모든 명령에 포함 
되여 있는 주소의 개수에 대하여 론하는것이다. 이 론의는 CPU 설계가 점점 복잡해 짐 
에 따라 큰 의의를 가지지는 못하지만 기본방식의 차이를 표현하고 분석한다는 견지에서 
는 지금도 효과적 인 방법으로 되고 있다. 

그러면 명령하나에 필요한 주소의 수는 최대로 얼마로 되겠는가? 명령들가운데서 산 
수론리연산명령들은 명백히 가장 많은 연산수들을 요구한다. 실지로 모든 산수론리연산 
명 령들은 하나 혹은 두개의 연산수들을 가지고 있다. 이로부터 연산수들을 참조하는데 
두개의 주소가 최대값으로 된다. 연산결과는 제 3의 주소를 정의하고 거기에 기억해야 한 
다. 명령실행이 끝나면 다음명령이 불리워 지므로 그의 주소가 또 요구된다. 

명령 해설 명령 해설 명령 해설 
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그림 9-3 에서는 Y = (A — B ) 수 (C + D X E ) 를 계산하는데 리용할수 있는 대 표적 인 
하나，둘，세개의 주소를 가진 명령들을 비교하였다. 세개의 주소를 가지면 매 명령이 2 
개 의 연산수위 치 와 결 과위 치 를 지 정 할수 있 다. 임 의 의 연산수위 치 값을 변화시 키 지 않는 
경우 림시기억위치 T 가 도중의 결과를 기억하는데 리용된다. 결국 5개의 연산수를 리용 
하여 4개의 명 령 으로 이것을 수행할수 있다. 

세개의 주소를 가진 명 령형식은 세 가지 주소참조를 위하여 상대적 으로 긴 명 령형식 
을 요구하므로 일반적으로 리용하기는 불편하다. 두개의 주소를 가진 명령에서는 2 진연 
산을 위하여 두 주소중 하나의 주소가 연산수 및 결과기억 용으로 리 용되 여 야 한다. 따라 
서 명령 SUBY , B 는 계산 Y - B 를 수행하고 모에 그 결과를 기억한다. 두개의 주소를 가 
진 명 령형식은 필요한 기 억공간을 줄이지 만 일부 불편한 점 도 있다. 즉 연산수의 값이 
바뀌지 않도록 하기 위하여 MOVE 명령을 리용하는데 이 명령은 연산이 수행되기전에 
결과 혹은 림시기 억위 치로 연산수값들중 하나를 옳긴다. 그림 9-3 에서 이 프로그람은 두 
개의 주소를 가진 6개의 명 령을 리용하여 작성되 였다. 

제일 간단한것은 하나의 주소만을 가진 명령이다. 이 명령이 정확히 수행되도록 하 
자면 두번째 주소는 이미 확정되 여 있어 야 한다. 이 명 령은 지난 시 기의 콤퓨터들에서도 
공통적 으로 리 용되 였 다. 두번째 주소의 확정 은 CPU 등록기 인 축적 기 혹은 AC 를 리 용하 
여 진행한다. 축적기는 어느 하나의 연산수를 가지며 연산결과를 기억하는데 리용된다. 
하나의 주소만을 가진 명령을 리용하면 Y 계산을 위한 산수연산은 그림 9-3 의 도에서 
알수 있는바와 같이 8개의 명 령 으로 수행할수 있다. 

사실상 일부 명 령에 대 하여서는 0 주소로 할수 있다. 0 주소명 령은 탄창이라고 하는 
특별한 기 억기조작에 적용할수 있다. 탄창의 조작은 후입선출 즉 마지막에 들어 간것 이 
제 일 먼저 나오는 규칙에 준하고 있다. 탄창은 정해 진 위치에 있으며 적 어도 꼭대 기 두 
개 의 요소들은 CPU 등록기 내 에 있 다. 그러 므로 0 주소명 령 은 두개 의 탄창요소를 참조한 
다. 탄창에 대 하여 서 는 부록 9-1 에 서 구체 적 으로 론의하였 다. 탄창의 리 용에 대 하여 서 는 
이 장과 제 10 장에 서 후에 더 론의한다. 

표 9-1 은 령，하나，둘 그리고 세개의 주소를 가진 명령에 대한 설명을 개괄하여 보 
여 주고 있다. 표에서는 모든 경우에 대하여 다음명 령의 주소가 확정되여 있으며 하나의 
연산이 두개의 원천연산수와 한개의 결과연산수를 가지고 수행된다고 가정하였다. 


표 9-1. 명령주소의 응용 ( 비분기명령 ) 


주소의 

개수 

기호표현 

설명 

3 


OP A, B, C 

A — B OP C 

2 


OP A, B 

A — A OP B 

1 


OP A 

AC — AC OP A 

0 


OP 

T — T OP (T-l) 

AC = 축적 기 

T = 탄창의 

A ， B，C : 기억기 

꼭대기 

혹은 등록기위치 



명령당 주소의 수는 설계를 위하여 결정해야 할 기초적인 수이다. 명령당 주소의 수 
를 적게 하면 보다 원시적인 명령들로 되여 CPU 의 복잡성을 줄이며 또한 길이가 보다 
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짧은 명령으로 된다. 따라서 일반적으로 실행시간이 보다 길어 지며 프로그람이 복잡해 
진다. 1 주소명 령과 여러 주소명령사이에는 등록기 리용에서 중요한 한계가 있다. 하나의 
주소명 령 을 리 용하는 경 우 프로그람작성 자는 일 반적 으로 하나의 일 반목적 등록기 인 축적 
기만을 리용할수 있다. 여러 주소명령을 쓰는 경우에는 공통적으로 여러개의 일반목적등 
륵기들을 리용할수 있다. 등록기들을 여러개 리용하게 되면 일부 연산을 등록기로만 할 
수 있다. 보통 등록기참조는 기억기참조보다 속도가 빠르므로 이렇게 하면 프로그람의 
집행속도를 높일수 있다. 이와 갈은 여 러개 등록기 리용의 유연성과 효과성 으로 하여 대 
부분 현대콤퓨터들에서는 둘 혹은 세개의 주소를 가진 명령을 쓴다. 

명령당 주소의 수를 얼마로 선정하겠는가 하는것은 여러가지 인자들의 영향을 고려 
하여 선정해야 할 복잡한 문제이다. 문제는 주소가 기억기위치를 참조하는가 아니면 등 
록기를 참조하는가 하는데 있다. 등록기의 개수가 작다면 보다 작은 비트들이 등록기참 
조에 요구된다. 또한 다음장에서 고찰하면 알수 있겠지만 콤퓨터는 여러가지 형태의 주 
소지정 방식들을 제공하며 이 방식의 규정에는 하나 혹은 그 이상의 비트들을 리용한다. 
결론적으로 대다수 CPU 설계에서는 여러가지 명령형식의 설계가 동반된다. 

5. 명령모임설계 

콤퓨터설계측면에서 볼 때 가장 흥미가 있을뿐아니라 이미 대부분이 해석되여 
있는것중의 하나는 명령모임설계이다. 명령모임설계는 그것이 콤퓨터체계의 많은 부 
분들에 영 향을 미치므로 매우 복잡하다. 명 령은 CPU 에서 수행하는 많은 기능들을 
정의하며 따라서 CPU 의 실현에서 매우 큰 의의를 가진다. 명령모임은 CPU 를 조종 
하는 프로그람작성자의 뜻이다. 결국 프로그람작성자의 요구는 명령모임설계에서 고 
찰해야 할 문제로 된다. 

명령모임설계와 관련한 일부 가장 근본적인 고찰이 아직 미해결로 남아 있다고 하면 
놀랄 사람들이 적지 않을것이다. 오히려 최근년간에 이 근본적인 고찰에서의 불일치성이 
점점 더 커지고 있다. 가장 중요한 기본설계자료들은 대체로 다음과 같다. 

• 연산지령표 혹은 연산저장고: 제공되는 연산의 크기와 위치，복잡성 

• 자료형 : 연산에 참가하는 여 러가지 형의 자료 

• 명령형식: 비트단위로 표현된 명령의 길이，주소의 개수，여러가지 마당의 크기 등 

• 등록기: 명령에 참조할수 있는 CPU 등록기의 수와 그것들의 리용 

• 주소지정 : 연산수의 주소를 규정하는 방식 혹은 방식들 

명령모임설계에서는 우의 설계자료들이 호상 련관되여 있으므로 모두 함께 고찰해야 
한다. 물론 일정한 순서에 따라서 이것들을 고찰해야 하지만 그것들의 호상관계를 고찰 
하는것 이 기본으로 된다. 

이상과 갈은 론의는 매우 중요하므로 제 3 편의 많은 내용들이 명령모임설계로 되여 
있다. 이 절에 뒤 이 어 이 장에서는 자료의 형과 연산저장고 (operation repertoire ) 에 대 
하여 고찰한다. 제 10 장에서는 주소지정방식과 명령형식을 론하며 제 12 장에서는 축소명 
령모임를퓨터 ( RISC ) 를 보기로 한다. RISC 기본방식에서는 많은 현대콤퓨터들에서 리용 
한 명 령 모임 설 계 사상을 대 부분 의 문시 하고 있 다. RISC 기 계 의 한 실례 가 바로 PowerPC 
이 다. 이 장과 다음장에서 PowerPC 를 고찰한다. 그러나 RISC 의 관계에 기초한 
PowerPC 의 의미는 제 12장에서 론의 한다. 
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제 2 절. 연산수의 종류 


기계명령은 자료에 대한 연산을 진행한다. 자료의 종류에는 대체로 다음과 갈은것이 
있 다. 

• 주소 

• 수 

• 문자 

• 론리자료 

주소는 실제상 한가지 자료의 양식 이 다. 앞으로 제 10 장에서 주소지정 방식 을 론의 하 
면 이것을 보다 명백히 알수 있다. 많은 경우에 일부 계산은 명령에서의 연산수참조로 
주기 억 기 혹은 가상기 억 기 주소를 결정 하여 수행 되 여 야 한다. 이 런 상황에 서 는 주소를 부 
호 없는 옹근수로 고찰할수 있다. 

이외에도 수,문자，론리자료 등의 자료형이 있으며 이것들도 이 절에서 간단히 고찰 
한다. 일부 콤퓨터들에서는 이와 갈은 형식의 자료외에도 특별한 자료형이나 자료구조를 
리용하고 있다. 실례로 문자목록 혹은 문자렬에 대하여 직접 연산을 진행하는 기계연산 
자도 있다. 

1. 수 

모든 기계어는 수값자료형을 가진다. 지어 비수값자료처리에서도 계수기, 마당폭 등 
으로 작용하는 수들이 요구될수 있다. 보통 수학에서 리용되는 수들과 콤퓨터에 기억된 
수들사이의 중요한 구별은 수자에 제 한성 이 있다는것 이 다. 그 리유는 우선 콤퓨터 에서 
표현할수 있는 수의 크기 가 제 한된다는것 이며 둘째 로는 류점수인 경우에 그것들의 정 확 
도에 제 한성 이 있다는것 이 다. 따라서 프로그람작성 자는 둥그리기，자리 넘 침, 아래 자리 넘 
침 등이 있는 결과를 얻게 된다. 

다음의 세가지 형의 수값자료는 모든 콤퓨터들에서 공통적 으로 리용되고 있다. 

• 옹근수 혹은 고점수 

• 류점수 

• 10진수 

우의 수값자료에서 첫 두개의 수값자료는 제 8장에서 이미 상세 히 고찰하였다. 여 기서는 
10진수에 대 하여 좀더 고찰한다. 

콤퓨터의 모든 내부연산이 본성적으로 2 진수로 진행된다고 해도 체계의 사용자인 
사람은 10진수를 리 용한다. 그러므로 입 력 에서 10 진수를 2진수로，출력 에서 2진수를 10 
진수로 바꾸어야 한다. I/O 를 많이 리용하는 응용이나 상대적으로 작고 또 상대적으로 
간단한 계 산에 서 는 10 진수형 태 로 수를 기 억하거 나 처 리하는것 이 더 좋다. 이 를 위하여 
조임 형 10 진수를 가장 일 반적 인 표현으로 리 용한다. 

조임형 10진수에서는 모든 10진수자가 4 bit 코드로 표현된다. 즉 0=0000, 1=0001，…， 
8=1000，9=10이 로 표현된다. 이것은 가능한 16 개의 4 bit 값들중에서 10 개만을 리용하므 
로 비 효과적 인 코드로 된다. 수를 형성할 때에는 보통 8 bit 의 배수로 되게 4 bit 코드들이 
서 로 한줄에 서 게 된 다. 례 를 들면 246 의 코드는 0000001001000110 으로 된 다. 이 코드는 
명백히 직접 2진수표현보다는 덜 압축된 형식 이지만 변화준비작업을 요구하지 않는다. 
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부의 수들은 조임 형 10 진수자렬의 왼쪽 혹은 오른쪽에 4 bit 부호자리 를 추가하여 표현한 
다. 실례로 코드 1111은〈-〉부호를 의미한다. 

대 다수 콤퓨터들은 조임형 10 진수에 대한 연산을 직접 수행하는 산수명령을 가지고 
있다. 알고리듬은 제 3 절에서 론의한 내용과 매우 류사하지만 반드시 10 진자리올림연산 
을 고려해 야 한다. 

2. 문 자 

자료는 보통 본문이나 문자렬로 이루어 진다. 이러한 본문자료가 사람에게는 가장 
편리하지만 그것을 문자그대로는 자료처 리 및 통신체계에 쉽게 기억하거 나 전송할수 없 
다. 이러한 체계들은 2 진자료를 대상으로 하여 설계된다. 그리하여 수많은 코드들이 문 
자를 비트렬로 표현할수 있도록 제안되였다. 가장 대표적인 실례는 모르스 ( Morse ) 코드 
이 다. 현재 가장 일 반적 으로 리 용되는 문자코드는 ASCII (American Standard Code for 
Information Interchange ) 로 규정 된 IRA (International Reference Alphabet ) 코드 이 다 
(표 6-1). 이 코드에서 매 문자는 단일한 7 bit 패린으로 표현된다. 따라서 이 코드를 리 
용하면 128개의 서 로 다른 문자를 표현할수 있다. 이것은 인쇄할수 있는 총 문자수를 넘 
는 큰 수이므로 패턴들중 일부는 조종문자로 리용한다. 조종문자들중에서 일부는 한 페 
지 씩 문자를 인쇄하는데 리 용하며 또 일 부는 통신순서 조종에 리용되 기 도 한다. IRA 로 
부호화된 문자들은 대체로 문자당 8 bit 로 기억되거나 전송된다. 여기서 8 번째 비트는 0 
으로 설정되거 나 오유검출용기우성비트로 리용되기도 한다. 기우성비트로 리 용되는 경우 
이 비트는 매 바이트에서 2 진수 1의 총수가 늘 기수(기수기우성)이거나 늘 우수(우수기 
우성)가 되도록 설정된다. 

표 6-1 에 서 는 IRA 비 트렬 011 XXXX 에 대 하여 수자 0 〜 9 를 그것 들의 오른쪽 4 bit 
가 0000 - 10()1 인 등가적 인 2 진수로 표현하였다. 이것은 조임형 10 진수와 같은 코드로 
써 7 bit IRA 와 4 bit 조임 형 10 진수표현사이 의 변환을 쉽 게 해 준다. 

문자를 부호화하는데 리용되 는 다른 하나의 코드는 확장된 2 진식 10 진상호변환코드 
( EBCE ) I 必 이 다. EBCDIC 는 IBM S /370 를퓨터 에 서 리 용되 고 있 다. 이 코드는 8 bit 코드 
이다. IRA 와 마찬가지로 EBCDIC 는 조임형 10진수와 호환성 이 있다. EBCDIC 에서는 코 
드 11110000 〜 11111001 이 수자 0 〜 9 를 표현한다. 

3. 론리자료 

보통 모든 단어 혹은 다른 주소지정단위(바이트，반단어 등)들은 단일한 자료단위로 
취급된다. 그러나 매 비트가 0혹은 1의 값을 가지는 n 개의 lbit 요소로 자료를 구성한 n 
비트단위를 리용하는것이 때로는 더 효과적이다. 자료를 이런 방법으로 고찰하는 경우 
이 자료를 론리자료라고 한다. 

자료를 비트단위로 고찰하면 두가지 우점이 있다. 첫째로，때때로 매 요소들이 오직 
값 1( 참)과 값 0( 거짓)만을 가질수 있는 불 혹은 2 진자료요소들의 배렬을 기억해야 할 
필요성도 제기될수 있다. 이때 론리자료로 처리하면 기억기를 가장 효과적으로 리용할수 
있다. 둘째로，자료요소의 비트들을 조작하려는 경우에 그 우점이 나타난다. 실례로 류점 
수연산을 프로그람적으로 수행한다면 일부 연산들에서는 무게를 가진 비트들을 밀기해야 
할 필요성이 제기된다. 다른 하나의 실례로서 ASCII 코드를 조임형 10진수로 바꾸자면 매 
바이 트의 오른쪽 4 bit 를 추출해 야 한다. 

이상의 실례를 통하여 같은 자료가 때로는 론리자료로 취급되기도 하고 때로는 수값 
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혹은 본문자료로도 된다는것을 알수 있다. 자료단위의《형》은 그 자료를 대상하는 연산 
에 의하여 결정된다. 이것은 고급언어 (실례로 Pascal ) 에서는 일반성을 가지지 않지만 기 
계어에서는 거의나 일반적인 경우로 된다. 


제 3 절. Pentium II 와 PowerPC 의 자료형식 


1. Pentium II 의 자료형 


Pentium II 는 길 이가 8( 바이트)， 16( 단어)， 32( 배 단어)， 64 bit (4 배 단어)인 자료형을 
처 리한다. 자료의 구조와 효과적 인 기 억 기 응용의 유연성 을 최대 로 높이기 위하여 단어들 
은 우수주소에 배 치 하지 않는다. 마찬가지 로 배단어 들은 4로 나누어 지 는 주소에 배 치 하 
지 않으며 4 배 단어 들은 8 로 나누어 지 는 주소에 배 치 하지 않는다. 그러 나 32 bit 모선을 
통하여 자료가 호출되 는 경 우에 는 4 로 나누어 지 는 주소에 서 시 작하여 배단어단위 로 진 
행된다. 처리장치는 잘못 배치된 값들에 대한 요구를 모선전달을 위한 요구렬로 바꾼다. 
Pentium II 는 모든 Intel 80 x 86 계 렬 과 마찬가지 로 작은끝격 식 ( little-endian style ) 을 리 
용한다. 즉 맨 아래 자리바이트가 제 일 낮은 주소에 기 억된다(끝배 치 ( endianness ) 에 대 
한 고찰은 부록 9-2 참고). 


표 9-2. Pentium 

n 의 자료형 

자료 형 

설명 

일반형 

임의의 2진수를 내용으로 가지는 바이트，단어 (16 bit )， 배단어 
(32 bit ) ，4 배 단어 (64 bit ) 위 치 들 

옹근수형 

2의 보수표현을 리 용하는 바이 트，단어 혹은 배단어 로 된 부호 없 
는 2 진수값 

순서 자료형 

바이트, 단어 혹은 배단어로 된 부호 없는 옹근수 

비조임 2진식 

10진수 ( BCD ) 형 

매 바이트로 하나의 수자를 표현하는 0〜9범위에 있는 BCD 수자의 
표현 

조임 BCD 형 

두개의 BCD 수자들의 조인 바이트표현，0〜99범 위의 값을 가전다. 

가까운 지시기형 

한 토막내에서의 변위를 표현하는 32 bit 의 유효주소. 

비토막화된 기억기에서는 모든 지시기에 대하여，토막화된 기억기 
에서는 한토막에서의 참조를 위해 리용한다. 

비 트마당형 

매 비트의 자리가 독립적인 단위로 고찰되는 련속비트렬은 임의의 
바이트의 임의의 비트에서 시작할수 있으며 2 32 -1 개의 바이트를 가 
질수 있다. 

바이트렬형 

0〜2 32 -1 개 의 바이 트를 가지 는 바이 트, 단어 혹은 배단어 로 된 련 
속바이트렬 

류동소수점 수형 

그림 9-4 참고. 


바이트，단어，배단어와 4배단어는 일반자료형 이 다. 추가적으로 Pentium II 는 개별 
적인 명령에 의하여 인식되고 연산되는 특수한 여러가지 자료형들의 배렬을 제공하고 있 
다. 표 9-2 는 이러한 형의 자료들을 개괄하여 보여 주고 있다. 

류점수형은 실제적으로 류동소수점수장치에서 리용하며 류점수명령에 의해 그 연산 
이 진행되는 자료형의 한 종류이다. 그림 9-4 에서 보여 준바와 같이 류점수명령은 류동 
소수점수는 물론 옹근수와 조임형 10진옹근수에 대 한 연산도 할수 있다. 옹근수들은 보통 
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2 의 보수로 표현된 수이며 16，32， 64 bit 의 긴 형 이 다. 조임 형 10 진옹근수는 0〜9 범위 
의 수를 18 개의 수자(한 수자는 4 bit ) 를 가진 부호-크기표현으로 기억된다. 이 세가지 
류점수표현는 IEEE 754표준에 부합된다. 


부호비트 (0 = 정수; 1 = 부수) 

10 진수자(바■이트당 2) 

.비트들이 의'미가 없음; 넣기에서 무시, 기억에서 령 
암시적인 소수점의 자리 

결수부의 옹근수비트;림시 실수로 기억, 단정확도 및 배정확도에서는 암시적임 


그림 9-4. Pentium II 수값자료의 형식 


2. PowerPC 의 자료형식 

PowerPC 는 길이가 8( 바이트)， 16( 반단어)， 32( 단어)， 64 bit (배단어)인 자료형을 처 
리 한다. 일부 명 령 에 서 는 기 억 기 연산수들이 32 bit 한계 로 일 치 되 여 야 한다. 그러 나 일 반 
적으로는 이렇게 되지 않는다. PowerPC 의 한가지 흥미 있는 특징은 작은끝 혹은 큰끝 
격식을 모두 리용할수 있다는것이다. 즉 맨 아래자리바이트는 가장 높은 주소 혹은 가장 
낮은 주소에 기억될수 있다(끝배치는 부록 9-2 참고). 

바이트，반단어，단어와 배단어는 일반자료형 이 다. 처 리장치는 명 령에 따라 주어 진 


최상위 주소바이트 


단어 
옹근수 


|(2의 보수) 


짧은 
옹근수 


|(2의 보수) 


: i 2 |) 


조임 형 
2 진식 
10 진수 


10 18 


Hi X |dl7fil6 1^15 ^14^13^12^11(^101^91^8 ^7^6 |d5|d4 |d3 j d2 L di L do| 


l^l 결수부 
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자료요소의 내용을 해석한다. 고점수처리장치 인 경우는 다음과 갈은 자료형을 인식한다. 

• 부호 없는 바이트형: 론리연산 혹은 옹근수산수연산에 리용될수 있다. 전체 등록 
기크기만큼 왼쪽에 0을 확장하여 기 억기 에서 일반등록기 에 로 자료를 넣는다. 

• 부호 없는 반단어형 : 부호 없는 바이트형과 같지만 자료의 크기 가 16 bit 이 다. 

• 부호 있는 반단어형 : 산수연산에 리용된다. 전체 등록기크기만큼 왼쪽에 부호비트 
를 확장하여 기 억기에 넣는다(모든 빈 자리에 부호비트가 들어 간다.). 

• 부호 없는 단어형 : 론리연산에 리용되며 주소지시기로도 리용된다. 

• 부호 있는 단어형 : 산수연산에 리용한다. 

• 부호 없는 배단어형 : 주소지시기 로 리용한다. 

• 바이트렬형: 길이가 (卜； L 雜 byte 

이 외 에 PowerPC 는 IEEE 754 에 서 정 의 한 단정 확도 및 배 정 확도류점 수형 의 자료도 
처 리할수 있 다. 


제 4 절. 연산의 종류 


여 러 가지 조작코드들의 수는 콤퓨터마다 다르다. 그러 나 모든 를퓨터들에서 연산의 서 
로 갈은 일반형 태들을 찾아 볼수 있다. 대표적 인 연산종류에는 다음과 같은것들이 있다. 

• 자료전송 

• 산수연산 

• 론리연산 

• 수변환 

• I/O 

• 체계조종 

• 조종이행 

표 9-3([ HAYE 88] 에 기초)에 매 연산종류에서 가장 많이 쓰이는 명 령들을 목록으 
로 주었다. 이 절에서는 CPU 가 표 9-4 에서 보여 준 알맞는 형의 명 령을 실행하는 동작 
을 간단히 론하면서 여 러가지 형의 명 령들을 간단히 개괄한다. 아래의 제목들은 제 11 장 
에 서 더 상세하게 검 토될 것 이 다. 


표 9-3. 일반적 인 명 령모임 연산 


형 연산 이름 

= 이동(전송) 

기억 

넣 기 (꺼 내 기 ) 
교환 

지우기(재설정) 
설정 

밀어넣기 


_ U _ 

단어 혹은 불로크를 원천으로부터 목적으로 전송한다. 

처 리장치로부터 기억기에로 단어를 전송한다. 

기 억기 로부터 처 리장치로 단어를 전송한다. 

원천 및 목적연산수의 내용을 교체한다. 

목적 연산수에 값이 0인 단어를 전송한다. 

목적연산수에 값이 1 인 단어를 전송한다. 

원천연산수로부터 탄창의 꼭대기에로 단어를 전송한다. 


밀어뼈 71 _ 탄창의 꼭대기에서 목적연산수로 단어를 전송한다. 
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더하기 

두 연산수의 합을 계산 


덜기 

두 연산수의 차를 계산 


곱하기 

두 연산수의 적을 계산 

산수 

나누기 

두 연산수의 상을 계산 

연산 

절대값 

연산수를 2의 절대 값으로 재 배치 


부정 

연산수의 부호를 변화시킨다. 


증가 

연산수에 1을 더한다. 


감소 

연산수에서 1을 던다. 


론리 곱하기 
론러더 하기 
론리 부정 (보수) 

안맞음론리더하기 
검사 

론리 

연산 비 교 

조종변수설정 

밀기 

회전 


^ 비트단위의 지정된 론리연산을 수행한다. 

지정된 조건을 검사하여 그 결과에 따라 기발을 설정한다. 

둘 혹은 그이상 연산수들은 론리적으로，산수적으로 비교하여 
그 결과에 따라 기 발을 설정 한다. 

새치기조종，시계조종 등의 보호목적을 위한 조종을 설정하는 
명령부류 

끝에 상수를 도입하여 연산수를 왼쪽(오른쪽)으로 민다. 

연산수의 두 끝을 결정한 상태에서 왼쪽(오른쪽)밀기를 한다. 


조종 

이행 


이행 (분기) 

조건이 행 

보조루린으로 이행 

복귀 _ 

실행 

건너뛰기 
조건건너뛰기 


무조건적 인 전송 즉 지정된 주소를 PC 에 넣는다. 

지정된 조건을 검사하여 그 조건에 따라 규정된 주소를 PC 에 
넣거나 아무것도 하지 않는다. 

알려 진 위치에 현재프로그람조종정보를 놓는다. 지정된 주소로 
이행 한다. 

알려 진 위 치 로부터 PC 와 다른 등록기 내용을 재배 치 한다. 
지정된 위치로부터 연산수를 불러 내여 명령으로서 실행한다. 
PC 는 변경시키지 않는다. 

PC 를 다음명 령 을 건너 뛰 도록 증가시 킨다. 

지정된 조건을 검사하여 조건에 따라 건너 뛰거나 뛰지 않는다. 


중지 

대기 (유지) 


프로그람집행을 중지한다. 

프로그람집행을 멈추고 지정된 조건을 반복검사하여 조건이 반 
복되는 경우에 실행을 다시 시작한다. 


비 연산 


입력 (읽기) 


연산이 수행되지 않지만 프로그람실행은 계속된다. _ 

지정된 " o 포구 혹은 장치로부터 목적연산수(주기억기 혹은 처리 
장치내의 등록기)에 자료를 전송 


입력/ 

출력 


출력(쓰기) 
I/O 시 작 


지정된 원천연산수로부터 I 八)포구 혹은 장치에 자료를 전송 
I 八)연산을 초기화하는 I 八)처리장치에 명령을 전송 


I 八)검사 I 八)체계로부터 지정된 목적연산수에로 상태정보를 전송 


번역 대웅표에 기초하여 기억기의 한 부분에 있는 값들을 번역한다. 

변환 한 형래에서 다른 형래에로 단어의 내용을 변환한다(조임형 10 

변환 진수로 변환한다). 
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표 9-4. 각이한 형 의 연산에 서 01*11-91 동작 


자료전송 

한 위 치 에 서 다른 위 치 에로 자료를 전송한다. 

기억기를 리용하는 경우에는; 

기억기주소를 결정한다. 

가상기 억기 주소를 실지 기 억기주소로 변환한다. 

캐쉬를 검사한다. 

기억 기 읽 기 /쓰기 를 초기 화한다. 

산수연산 

산수연산의 전과 후에 자료전송이 동반된다. 

ALU 에 서 기 능을 수행 한다. 

조건코드와 기 발을 설 정한다. 

론리 연산 

산수연산과 갈다. 

변환 

산수 및 론리 연산과 같다. 변환을 수행 하는 특별한 론리가 동반될수 있다. 

조종이 행 

프로그람계수기를 갱신한다. 보조프로그람의 호출/복귀를 위 하여 파라메 터 넘기 
기와 련결을 관리 한다. 

I/O 

I 八)모듈에 지 령을 발행한다. 

기 억 배 치 형 I/O 인 경 우 기 억 배 치 주소를 결 정 한다. 


1 . 자료전송 

기계명령의 가장 기본적인 형은 자료전송명령이다. 자료전송명령에서는 다음과 갈은 
것들을 규정 해 주어 야 한다. 첫째 로，원천 및 목적 연산수의 위 치를 규정 해 야 한다. 매 위 
치는 기억기나 등록기 혹은 탄창의 곡대기일수 있다. 둘째로，이동하는 자료의 길이가 지 
적되여야 한다. 셋째로，연산수를 가진 모든 명령과 마찬가지로 자료전송명령에서도 매 
연산수의 주소지정방식이 규정되여야 한다. 주소지정방식에 대하여서는 제 10장에서 고찰 
한다. 

명령모임에 들어 있는 자료전송명령의 선택은 설계가들이 어떤 합리적인 방안을 리 
용하였는가를 보여 준다. 실례로 연산수의 위치(기억기 혹은 등록기)는 일반적으로 조작 
코드나 연산수의 형 식 화에 의하여 지 정할수 있 다. 표 9-5 는 가장 일 반적 인 IBM S /370 
의 자료전송명령을 보여 주고 있다. 자료전송명령에는 전송되는 자료의 량(8，16，32 혹 
은 64 bit ) 을 지 정하는 변 량들이 있 다. 


표 9-5. IBM S /370 지료전송연산의 실례 


연산략어 

이 름 

전송되는 
비트수 

설명 

L 

넣기 

32 

기억기에서 등록기에로 전송한다. 

LH 

반단어 넣기 

16 

기억기에서 등록기에로 전송한다. 

LR 

넣기 

32 

등록기에서 기억기에로 전송한다. 

LER 

넣기 (짧은 형식) 

32 

류점 수등록기 에 서 류점 수등록기 에 로 전송한다. 

LE 

넣기 (짧은 형식) 

32 

기 억 기 에서 류동소수점 수등록기 에 로 전송한다. 

LDR 

넣기(긴 형식) 

64 

류점 수등록기 에 서 류점 수등록기 에 로 전송한다. 

ST 

기억 

32 

.록기에서 기억기에로 전송한다. 

STH 

반단어 기억 

16 

-管륵기에서 기억기에로 전송한다. 

STC 

문자기 억 

8 

등록기에서 기억기에로 전송한다. 

STE 

기억(짧은 형식) 

32 

류점 수등록기 에 서 기 억 기 에 로 전송한다. 

STD 

기억(긴 형식) 

64 

류점 수등록기 에 서 기 억 기 에 로 전송한다. 
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또한 등록기에서 등록기로，등록기에서 기억기에로，기억기에서 등록기에로 자료를 전송 
하는 여 러 가지 명 령들도 있다. VAX 콤퓨터 와 비 교해 보면 VAX 는 전송하는 자료의 각 
이한 크기를 표현하는 변량을 가진 이동 ( MOV ) 명령을 가지고 있다. 이 명령은 연산수가 
등록기인가 혹은 연산수의 한 부분으로서의 기 억기 인가 하는것 까지도 규정한다. 따라서 
VAX 방법은 프로그람작성 자가 보다 적은 명 령을 가지 고 프로그람을 작성할수 있게 하므 
로 어느 정도 더 쉬워 보인다. 그러나 이 방법은 매 연산수의 위 치 (등록기 대 기억기)를 
명령과는 독립적으로 규정 해야 하므로 IBM S /370 방법보다는 어느 정도 명령이 더 긴 방 
법이다. 이 차이는 다음장에서 명령형식을 론하면서 고찰한다. 

CPU 동작의 견지에서 볼 때 자료전송명 령은 가장 단순한 명 령형태 이 다. 원천 및 목 
적 연산수들이 둘 다 등록기 인 경 우 CPU 는 간단히 자료가 한 등록기 에 서 다른 등록기 에 
로 이동하게 한다. 이것은 CPU 내부에서의 연산이다. 하나 혹은 두개의 연산수들이 
기 억 기 에 있는 경 우 CPU 는 다음과 갈은 동작의 일부 혹은 모두를 수행 해 야 한다. 

1. 주소지정 방식 에 기초하여 기 억기주소를 계산한다(이 내용은 제 10 장에서 고찰) . 

2. 주소가 가상기억기와 관련되는 경우 가상기억기주소를 실기억기주소로 바꾼다. 

3. 주소가 캐 쉬 주소인가를 판정한다. 

4. 아니면 기 억기모둘에 지 령을 발행한다. 

2. 산수연산 

대다수 콤퓨터들은 더하기，덜기，곱하기，나누기의 기본산수연산을 수행한다. 산수연산 
에서는 부호 있는 옹근수(고점수)，류점수，조임형 10진수 등을 리용한다. 

산수연산명령 에는 이외에도 여러가지 단일연산수명 령들이 있다. 실례를 들면 다음과 갈다. 

• 절대값: 연산수의 절대값을 취한다. 

• 부수: 연산수의 부호를 반전시킨다. 

• 중가: 연산수를 1만큼 증가시 킨다. 

• 감소: 연산수를 1만큼 감소시 킨다. 

산수연산명령의 실행에는 ALU 에 입구하기 위한 연산수를 정하며 ALU 에서 계산된 
결과를 그 출력에서 넘겨 받는 자료전송명 령 이 동반되게 된다. 그림 3-5 는 이 과정 즉 
자료전송과 산수연산이 동반되는 과정을 보여 준다. 물론 ALU 는 이외에도 CPU 의 한 
부분으로서 필요한 연산을 수행한다. 

3. 론리연산 

콤퓨터들은 보통 단어 혹은 기타 자료단위들의 개별적인 비트들을 조작할수 있는 여 
러 가지 명 령들을 가지 고 있다. 이 연산들은 불연산(부록 1 참고)에 기초하고 있다. 

불 혹은 2진자료에 대하여 수행되는 기본론리연산명령의 일부를 표 9-6 에 보여 주었다. 

표 9-6. 기본론리 연산 


P 

Q 

NOT P 

P AND Q 

P OR Q 

P XOR Q 

P=Q 

0 

0 

1 

0 

0 

0 

1 

0 

1 

1 

0 

1 

1 

0 

1 

0 

0 

0 

1 

1 

0 

1 

1 

0 

1 

1 

0 

1 
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NOT 연산은 한 비 트를 반전시 키 며 AND , OR , XOR 는 각각 론리 곱하기 , 론리 더 하기 , 안 
맞음론리 더 하기 연산으로서 두 연산수를 리 용하는 가장 일 반적 인 론리 연산기 능이 다. 
EQUAL 은 효과적 인 2진수검 사연산이다. 

이와 갈은 론리연산들은 n 비트의 론리 자료단위들에 비트단위로 적용할수 있다. 이제 
두 등록기가 다음과 같은 자료를 가지고 있다면 
( R 1) = 10100101 
( R 2) = 00001111 
이때 

( Rl ) AND ( R 2) = 00000101 

로 된다. 여기서 표현법 (幻은 위치 표의 내용을 의미한다. AND 연산은 한 단어에서 일 
정한 비트들을 선택 하고 나머지는 령 으로 지우는데 리 용할수 있다. 다른 실례 로 두 등록 
기에 각각 다음의 자료가 있다고 하자. 

( R 1) = 10100101 
( R 2) = 11111111 

이때 

( Rl ) XOR ( R 2) = 01011010 

으로 된 다. 이 로부터 모든 비 트가 1 인 단어 가 안맞음론리 더 하기연산에 참가하면 다른 단 
어의 모든 비트가 반전된 결과가 얻 어 진다는것을 알수 있다 (1 의 보수). 

비 트별 론리연산외 에 도 대 다수 콤퓨터 들은 여 러 가지 밀 기 및 회 전기 능을 가지 고 있 
다. 가장 기본적인 연산을 그림 9-5 에 보여 주었다. 론리밀기는 단어의 비트들을 왼쪽 혹 
은 오른쪽으로 미는 연산이 다. 한끝에서 밖으로 밀리운 비트는 잃어 버리며 다른쪽 끝에는 
0 이 들어 가게 된다. 론리밀기는 우선 한단어 내에서 마당을 분리 하는데 쓸수 있다. 단어안 
으로 밀려 들어 온 0 은 다른쪽 끝에서 밀려 밖으로 나간 불필요한 정보와 교체된다. 


U 一느^重^惠소그^墓스 




사 ，、，"、重"、紅厂、 







그림 9-5. 밀기 및 회전연산 


ᄀ_론러오른쪽밀기, 론러왼쪽밀기, 산수오른쪽밀기, 

H _ 산수왼쪽밀기, n _ 오른쪽 회전, H — 왼쪽 회전 


실례로 문자자료를 1/◦장치에 한번에 한 문자씩 전송하는 경우를 고찰해 보자. 매 기 
억기단어는 길이가 16 bit 이므로 두 문자를 가질수 있으며 따라서 이 문자들을 보내기 전 
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에 한 문자씩 갈라야 한다. 한 단어에 있는 두 문자를 보내기 위하여 다음과 같이 한다. 

1. 단어 를 등록기 에 넣 는다. 

2. 1111111100000000 과 등록기 내용을 론리 곱하기 ( AND ) 한다. 이것은 오른쪽에 있는 
문자를 마스크 하기 위한것 이다. 

3. 결과를 8 번 오른쪽으로 민다. 이것은 등록기의 오른쪽 절반위 치 에 마스크되지 않 
은 다른 문자를 밀 어 넣 기 위한것 이 다. 

4.1 八) 를 수행 한다. I 八) 모둘은 자료모선에 서 낮은 자리 8 bit 를 읽 는다. 

이 단계는 한 단어에서 왼쪽문자를 전송하는 과정이다. 오른쪽문자를 보낼 때에는 다음 
과 같이 한다. 

1. 다시 등록기에 단어를 넣는다. 

2. 00000000111111111 과 등록기 내 용을 론리 곱하기 한다. 

3. I 八)를 수행한다. 

산수밀기연산은 부호 있는 옹근수로서 자료를 취급하며 부호비트는 밀리지만 내용은 
변하지 않는다. 오른쪽 산수밀기에서 부호비트는 그의 오른쪽 비트위치로 옮겨 지지만 
부호비 트의 내 용은 변하지 않는다. 이 연산들은 산수연산의 속도를 일정하게 높일수 있 
게 한다. 2 의 보수표기로 표현된 수들에 대한 왼쪽 및 오른쪽밀기는 자리넘침이나 아래 
자리넘침이 없는 경우 특별히 2에 의한 곱하기 및 나누기에 대응한다. 

회 전 혹은 순환밀기연산은 연산에 참가하고 있는 모든 비 트들을 보존한다. 회 전연산 
의 한가지 특징은 매 비트를 련속적으로 제일 왼쪽 비트위치로 가져 가는것이다. 이것은 
수로서 취 급되 는 자료의 부호를 검 사하기 위한것 으로 볼수 있 다. 

산수연산과 마찬가지 로 론리연산에 도 ALU 의 작용과 자료전송명 령 이 동반된 다. 

4. 변환 

변환명령은 수의 형식을 변화시키거나 자료의 형식에 대한 연산을 진행하는 명령이 
다. 대표적인 실례는 10 진수를 2 진수로 바꾸는것이다. 보다 복잡한 편집명령의 실례는 
S /370 변환 ( TR ) 명 령 이 다. 이 명 령은 하나의 8 bit 코드를 다른 8 bit 코드로 변환하는데 리 
용할수 있으며 이때 이 명 령은 세개의 연산수를 가진다. 

TR Ri ， R ，2> L 

이 명 령 에서 연산수 R 2 는 8 bit 코드표의 시 작주소를 가진다. &에서 지정된 주소에 
서 시 작하는 L 개의 바이 트들은 변환되 여 매 바이 트에 첨 수가 불은 표기입 내 용들로 재배 
치 된다. 실례 로 EBCDIC 를 ASCII 코드로 변환하기 위하여 우선 1000〜 10 FF 까지의 16 
진수기 억기위 치 에 256 byte 의 표를 만든다. 이 표는 2 진수표현로 된 EBCDIC 코드의 순 
서 로 ASCII 코드의 문자들을 가진 다. 즉 ASCII 코드는 표에 서 그 문자의 EBCDIC 코드의 
2 진수값과 같은 상대적위치에 배 치된다. 따라서 위치 10 F 0-10 F 9 는 값 30-39 를 가지 
게 된다. 이것은 F 0 이 수자 0 에 대한 EBCDIC 코드이고 30 은 수자 0 에 대한 ASCII 코드 
이며 이 런 방법 으로 수자 9 까지 나가기때문이 다. 이제 위 치 2100 에 있는 수 1984 에 대 한 
EBCDIC 코드를 ASCII 코드로 변환하는 경 우를 보자. 이 를 위 하여 다음과 같이 가정 한다. 

• 위 치 2100〜2103 은 FI F 9 F 8 F 4 를 가진 다. 

• & 은 2100 을 가지 고 있 다. 
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• R2 는 1000 을 가지 고 있 다 . 

이 와 같이 가정 하고 TR Ri , R 2 , 4 를 실 행 하면 위 치 2100〜2103 에 31 39 38 34 를 넣 을 
수 있다. 

5. 입출력 

입출력명 령은 그 일부를 제 6 장에서 상세히 고찰하였다. 여기서 본바와 같이 I/O 에 
는 분리 된 프로그람식 I / O , 기 억 기 배 치 프로그람식 I / O , 직 접 기 억 기 호출 ( DMA ) 등을 비 롯 
하여 여 러 가지 I/O 가 있 다. 또한 I/O 처 리 장치 의 리 용도 여 러 가지 이 다. 입 출력 은 몇 개 의 
I/O 명 령 만으로 수행 되 는데 이 I 八3 명 령 들은 파라메터，코드 혹은 지 령단어 에 의하여 규 
정되는 특별한 작용을 한다. 

6. 체계조종 

체계조종명령은 처리장치가 확실한 특권상태에 있거나 기억기의 특수한 특권령역안 
에서 프로그람을 집행하고 있는 동안에만 실행될수 있는 명령이다. 이 명령은 특별히 조 
작체계를 리용하기 위해 예약된것이다. 

몇가지 체계조종연산의 실례를 들면 다음과 갈다. 체계조종명령은 조종등록기를 읽 
거나 바끌수 있다. 조종등록기에 대해서는 제 11 장에서 고찰한다. 체계조종명령에는 또한 
S /370 기억기체계에서 리용된것과 같은 기억기보호열쇠를 읽거나 변경하는 명령이 있다. 
이외 에도 다중프로그람작성체계 에서 조종블로크를 처 리 하기 위한 호출명 령도 있다. 

7. 조종이행 

지금까지 론의한 모든 형태의 연산들에서 다음에 실행할 명령은 기억기에서 현재명 
령의 직후에 배렬된 명령이다. 임의의 프로그람의 명령렬들가운데서 중요한 부분의 하나 
는 명령실행의 순서를 변화시키는 기능을 가지는것이다. 이 명령들에 대하여 CPU 에 의 
하여 수행되는 연산은 프로그람계수기가 기억기에 있는 어떤 명령의 주소를 가지도록 갱 
신 하는것 이 다. 

조종이행연산이 필요한 리유에는 여러가지가 있다. 이 가운데서 가장 중요한것들은 
다음과 갈다. 

1. 콤퓨터의 실지 리용에서는 모든 명령을 한번이상으로，필요하다면 수천번이상 실 
행할수 있다. 또한 하나의 응용프로그람을 만들자고 해도 수천 혹은 수백만개의 
명령들이 요구될수 있다. 이러한 경우에 개별적으로 모든 명령들을 일일이 쓴다 
는것은 생각할수도 없는 일이다. 만일 표자료라든가 항목들을 가진 목록자료라면 
프로그람순환이 요구될수 있다. 이와 같은 경우에는 하나의 명령렬로 모든 자료 
를 처 리할수 있도록 반복실행시킨다. 

2. 실지 모든 프로그람들은 일부 판정조건을 만들어 리용한다. 콤퓨터는 한가지 조 
건이 주어 지면 그 일을 수행 하고 다른 조건이 주어 지면 또 그 일을 수행할수 
있어야 한다. 실례로 하나의 명령렬이 수의 두제곱뿌리를 계산하는 경우를 보자. 
이 때 이 명 령렬의 시 작부분에서 는 우선 수의 부호가 검 사된다. 수가 부수이 면 계 
산을 수행하지 않고 오유조건 이 보고된 다. 

3. 큰 프로그람 혹은 지 어 중간크기 정 도의 프로그람이라고 해 도 그것 을 정 확히 구 
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성하는것은 사실상 매우 어 려운 과제 이다. 한번에 하나의 프로그람으로 실행될수 
있는 보다 작은 프로그람들로 과제를 분할하는 기구가 있다면 조종이행은 이것 
을 가능하게 한다. 

아래 에서는 가장 일반적 인 조종이행연산명 령들인 분기명 령，건너뛰기명 령，틀호출명 
령에 대하여 고찰한다. 

린 Igg 

이행명령이라고 하는 분기명령은 실행해야 할 다음명령의 주소를 연산수로 가진다. 
이러한 명령들은 보통 조건분기명령으로 된다. 분기는 일정한 조건이 만족되는 경우에만 
이루어 진다. 다시말하여 프로그람계수기를 연산수에서 지정된 주소로 갱신한다. 만약 조 
건이 만족되지 않으면 다음명 령 이 실행 된다(정상적 으로 프로그람계수기 를 증가시 킨다. ) . 

조건분기명령에서 조건을 발생시키는 일반적인 방법에는 두가지가 있다. 대부분 콤 
퓨터들은 일부 연산결과로 설정되는 한비트 혹은 여러 비트의 조건코드를 준다. 이 코드 
는 사용자가 볼수 있는 등록기라고 생각할수 있다. 실례로 산수연산(더하기，덜기 등)은 
다음과 같은 4 가지 값 즉 0，+，_，자리넘 침 가운데 서 하나를 선정 할수 있 는 2 bit 조건코 
드를 설정할수 있다. 이 와 갈은 콤퓨터 에는 다음과 갈은 4 개의 서 로 다른 조건분기명 령 
들이 있다. 

BRP X 결과가 정수인 경우 위치 표로 이행한다. 

BRN X 결과가 부수인 경우 위 치 표 로 이 행한다. 

BRZ X 결과가 0 이면 위 치 표 로 이 행한다. 

BRO X 자리넘침이 생긴 경우 위치 표로 이행한다. 

우의 4가지 경 우에 귀 착되 는 결 과는 조건코드를 설 정하는 가장 최 근의 연산결 과이 다. 

3 개의 주소를 가진 명령형식에 리용할수 있는 다른 한가지 방법은 비교연산을 진행 
하여 그 명 령 에서 분기 를 규정하는것 이 다. 실례 를 풀면 다음과 같다. 

BRE R x , R 2 , X Ri 의 내용 = R 2 의 내용이면 표로 이행 


기억기 명령 
주소 

200 
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그림 9-6. 분기명령 




그림 9-6 에는 이 러한 연산실례를 보여 주었다. 분기는 정 방향(보다 높은 주소를 가진 명 
령) 혹은 역방향(보다 낮은 주소)으로 일어 날수 있다. 이 그림의 실례는 명령의 반복고 
리를 만드는데 무조건 및 조건분기가 어떻게 리용되는가를 보여 주고 있다. 즉 위치 202 
로부터 210 사이에 있는 명령들은 X 로부터 Y 를 던 결과가 0 으로 될 때까지 반복하여 
실행된다. 

건너뛰기명령 

다른 한가지 조종이행연산명 령은 건너뛰기명 령 이 다. 건너뛰기명 령은 암시적 인 주소 
를 가지고 있다. 건너뛰기명령은 한개 명령을 뛰여 넘는다는것을 암시하므로 암시적인 
주소는 다음명 령의 주소와 한개 명 령의 길 이를 더한것으로 된다. 

건너뛰기명령에는 목적주소마당이 필요 없으므로 다른 일은 하지 못한다. 대표적인 
실례는 령인 경우 증가 및 건너뛰기 ( ISZ ) 명령이다. 이제 다음과 같은 프로그람의 토막을 
생각하자. 

301 


309 ISZ Ri 

310 BR 301 

311 

이 토막에서는 반복순환을 만드는데 2 개의 조종이행명령을 리용하고 있다. 따에는 부의 
반복수가 설정된다. 이 &은 순환의 끝에서 증가한다. 따 의 값이 0 이 아니면 프로그람 
은 고리의 시작으로 되돌아 온다. 만약 &의 값이 0이면 고리에서 벗어 나도록 건너뛰기 
명령이 작용하며 고리의 끝다음명령에 의해 프로그람은 계속 실행된다. 

틀호출명령 

프로그람작성언어의 개발에서 가장 큰 혁 신은 틀의 개 념을 받아 들인것 이 다. 틀은 
그자체 가 하나의 프로그람으로서 보다 큰 프로그람에 들어 가는 프로그람이다. 틀은 프 
로그람안의 임의의 위치에서 호출할수 있다. 프로그람은 처리장치의 틀에 가서 그 틀을 
실 행 하고 그다음 호출이 발생 한 위 치 로 돌아 올것 을 명 령 한다. 

틀을 리용하는 리유는 경제성 과 모둘화의 두가지 이 다. 우선 틀은 틀내의 명 령렬들이 
여러번 리용될수 있게 한다. 이것은 프로그람작성로력을 줄일수 있는 매우 경제적인 방 
법 이며 또 체계내 에서의 기 억공간을 보다 효과적으로 리용할수 있게 한다. 틀은 또한 큰 
프로그람작성과제를 보다 작은 분과제로 나눌수 있게 한다. 이것을 프로그람의 모듈화라 
고 하며 이 것은 프로그람작성 과제 를 짧은 기 간에 쉽 게 수행할수 있게 한다. 

틀기 구에 는 두개 의 기 본명 령 즉 현 위 치 에서 틀에 로 이 행하는 호출명 령 과 틀로부터 
그것이 호출된 위치에로 돌아 가는 복귀명령이 있다. 이 두 명령은 모두 분기명령에 속 
한다. 

그림 9-7 자는 프로그람에서 리용되는 틀들을 보여 주고 있다. 이 실례에서는 주프로 
그람이 기 억기위치 4000에 있다. 프로그람은 위 치 4000에서 시 작하면서 틀 PROC 1 을 호 
출한다. PROC 1 에 대 한 호출명 령을 만나게 되면 CPU 는 주프로그람의 집행을 중지 하고 
위치 4500으로부터 다음명령을 불러 내여 PROC 1 의 실행을 시작한다. PROC 1 내에는 위 
치 4800 에 있는 PROC 2 에 대 한 두번의 호출이 있다. PROC 2 이 호출될 때 마다 PROC 1 
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여 기서 RN 은 늘 복귀주소보관목적 으로 리용되는 등록기 이 다. PC 는 프로그람계수기 이 고 
A 는 명 령길이 이 다. 호출된 틀은 후에 복귀 에 리용할 RN 의 내용을 보관한다. 

두번째 방법은 틀의 시작부에 복귀주소를 기 억하는것 이 다. 이 경우에 CALL X 는 
다음과 갈은 동작을 수행한다. 


X —PC 시 
PC — X + 1 


이 동작은 매우 간단하며 복귀주소는 안전하게 보관된다. 

이 상의 두 방법 들은 복귀 주소보관에 효과적 으로 리용되 고 있 다. 단지 이 방법 들의 
제한성은 재진입가능한 들을 리용하지 못한다는것이다. 재진입가능한 들은 같은 시간에 
여 러개의 호출이 그것을 열수 있는 틀이 다. 순환틀(그자체를 호출하는 틀) 이 바로 이 특 
징을 리용한 대표적인 실례로 된다. 

보다 더 일 반적 이 며 쓸모 있는 방법 은 탄창을 리용하는것 이 다(탄창에 대 한 론의 는 
부록 9-1 참고) . CPU 는 호출할 때 탄창에 복귀 주소를 보관한다. 또한 틀로부터 복귀 할 
때에는 탄창에 보관한 이 주소를 리용한다. 그림 9-8 에 이와 같은 탄창의 리용에 대하여 
보여 주었 다. 틀호출에 서 는 이 와 같이 복귀 주소를 제 공하는것 외 에 파라메터 를 넘 겨 주어 
야 한다. 보통 이 파라메터 들은 등록기 를 통하여 틀에 넘 겨 진다. 



그림 9-8. 그림 9-7 의 겹쌓인 보조루린실현에서 탄창의 리용 
■卜초기 탄창내 용， l-CALL Procl 후，[-초기 CALL Proc2, ᄅ-복귀 후， 
n-CALL Proc2 후， H- 복귀 후, A- 복귀 후 

이 방법 외 에 도 CALL 명 령 후 기 억 기 에 파라메터 들을 기 억 하는 방법 이 있 다. 이 경 우 
에 는 복귀 주소를 파라메터 가 보관되 여 있는 다음위 치 에 기 억 해 야 한다. 이 두가지 방법 
들은 부족점 을 가지 고 있 다. 등록기 를 리용하는 경 우에 는 등록기 들이 알맞게 리용될수 
있도록 호출된 프로그람과 호출하는 프로그람을 작성해 야 한다. 기 억 기 에 파라메터 들을 
기 억하는 방법 의 결 함은 여 러 가지 값을 가질 수 있는 파라메터 들을 교환하기 가 힘 든것 이 
다. 이 두 방법들도 재진입가능한 틀을 리용하지 못한다. 

파라메터를 넘 겨 주는 보다 유연한 방법 은 탄창을 리용하는것 이 다. 이 방법 에서는 
처 리 장치 가 틀을 호출할 때 복귀주소만 탄창에 보관하는것 이 아니 라 호출된 틀에 넘 겨 
주어 야 할 파라메터 까지 도 탄창에 보관한다. 호출된 틀은 탄창으로부터 파라메터 를 꺼 내 
여 리용한다. 복귀할 때에도 복귀파라메터들이 탄창에 배 치된다. 복귀주소를 비롯한 이와 
같은 파라메터 들의 전체 모임 을 탄창프레 임 이라고 한다. 

그림 9-9 에는 틀호출과 관련한 탄창틀의 리용을 보여 주었다. 이 실례 에서는 국부변 
수 XI과 X2 가 선언되는 틀 P 와 이 P 에 의해 호출되는 국부변수 Y1 과 Y2 를 선언하는 
틀 Q 를 정의하고 있다. 그림에서 매틀의 복귀점은 대응하는 탄창들에 기억된 첫번째 항 
목이 다. 그다음에는 앞틀의 시 작을 가리 키는 지시 자를 기 억한다. 이것은 탄창에 쌓아 지 
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는 파라메터들의 수나 길이가 변하는 경우에 필요하게 된다. 





탄창 

y 2 

1 

Q ： 


" —지시기 

yi 

낡은■지시기 


_■지시기 

복귀점 



X2 

탄창 


' -지시기 

Xl 


XI 

y 은■지시기 

4 _■지시기 

단은■지시기 



복귀점 

P ： 

복귀점 


그림 9-9. 실례틀 P 와 Q 를 리용한 탄창틀의 증가 [ DEWA 90] 
P 4 능동， i__P 가 Q 를 호출 


제 5 절 . Pentium 11 와 PowerPC 의 연산종류 

1 . Pentium n 의 연산종류 

Pentium II 는 여러개의 전문화된 명령을 비롯하여 복잡한 계렬의 연산형을 가지고 
있다. Pentium II 의 목적은 고급언어로 작성된 프로그람을 최적인 기계어로 번역하는 를 
파일 러 의 작성 도구를 제 공하는것이 였 다. 표 9-7 에 Pentium II 의 연산종류와 그 실례 들을 
보여 주었다. 대부분 명령들은 일반적인 콤퓨터명령모임에서 찾아 볼수 있는 명령들이지 
만 일부는 80 x 86 / Pentium 기 본방식 에 알맞는것 으로서 흥미 가 있는것 들도 있 다. 


표 9-7. Pentium II 의 조작형래 (대표적 인 연산실례를 포함) 


명령 설명 


자료전송 

MOV 등록기들사이 혹은 등록기와 기 억기사이에서 연산수를 전송 

PUSH 탄창에 연산수를 밀어넣기 

PUSHA 탄창에 모든 등록기를 밀어넣기 

바이트, 단어，배단어，확장된 부호를 전송. 바이 트를 단어 로，단어 를 배단어 로 
MUViA 이동하며 이때 2의 보수부호확장을 한다. 

LEA 유효주소 넣기. 목적연산수에 대한 값이 아니라 원천연산수의 변위를 넣는다. 
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표 계속 


XLAT 

IN, OUT 

표검 사번 역 . 사용자코드번 역표로부터 한바이 트등록기인 AL 에 한바이 트를 재 배 
치한다. XLAT 가 실행될 때 AL 은 표에 대한 부호 없는 첨수를 가진다. 

XLAT 는 표첨 수로부터 표기입 까지 AL 의 내 용을 변화시 킨다. 

I 八)로부터 연산수를 입력，출력 

산수 연산 

ADD 

SUB 

MUL 

IDIV 

연산수들의 더하기 
연산수들의 덜기 

바이트，단어 혹은 배단어연산수들과 단어，배단어 혹은 4 배단어의 결과를 
가지는 부호 없는 옹근수곱하기 
부호 있는 나누기 

론러 연산 

AND 

BTS 

BSF 

SHL/SHR 

SAL/SAR 

ROL/ROR 

SETCC 

연산수들의 론리곱하기 

비트검사와 설정. 비트마당의 연산수에 대한 연산을 한다 . 이 명령은 한비트의 
현재 값을 CF 기 발에 복사하고 원래 비 트를 1 로 설정한다. 

정 방향비 트주사. 단어 혹은 배단어 에 서 1 인 비 트를 주사하여 처 음으로 만나는 1 
의 번호를 등록기 에 기 억한다. 

론리왼쪽 혹은 오른쪽밀기 
산수왼쪽 혹은 오른쪽밀기 
왼쪽 혹은 오른쪽회전 

상태기발에서 정의된 16 개의 조건에 따라 한바이트를 령 혹은 1 로 설정한다. 

조종이 행 

JMP 

CALL 

JE/JZ 

LOOPE/LO 

OPZ 

INT/INTO 

무조건이 행 

다른 위치로 조종을 넘기기. 조종을 이행하기전에 CALL 에 뒤따르는 배렬주소 
가 탄창에 보관된다. 

같거나 령인 경우 이행 

같거나 령 인 경우 순환. 이것은 등록기 ECX 에 기 억된 값을 리용하는 조건이행 이 
다. 명령은 분기조건을 위하여 ECX 를 검사하기전에 먼저 EXC 를 감소시킨다. 

자리넘침인 경우 새치기. 새치기봉사루린에로 조종을 넘긴다. 

문자 렬 연산 

MOVS 

LODS 

바이트, 단어, 배단어문자렬을 이동. 명령은 문자렬의 임의의 요소에 대하여 연산을 진행 
하는데 이 지적은 등록기 ESI 와 EDI 가 한다. 매 문자렬의 연산수등록기들은 자동적으 
로 문자렬의 다음요소를 지시하도록 증가 혹은 감소된다. 

바이 트, 단어，배단어 의 문자렬 을 넣 기 

고급언어지원연산 

ENTER 

LEAVE 

BOUND 

블로크로 구조화된 고급언어의 규칙을 실현하는데 리용될수 있는 탄창틀을 창조 
앞의 ENTER 의 동작과 반대 인 연산 

배 렬한계검사. 연산수 1 의 값은 두 한계값 즉 웃한계와 아래 한계사이 에 있다. 이 한계값 
들은 연산수 2 에서 참조하는 두 린접기억기위치내에 있다. 값이 이 한계범위를 벗어 나면 
새치기가 일어 난다. 이 명령은 배렬첨수를 검사하는데 리용한다. 

기발 조종 

STC 

LAHF 

자리올림기발설정 

A 등록기에 기발들을 넣기. A 등록기에는 SF, ZF, AF, PF 와 CF 비트들이 복사된다. 

토막 등록기 

LDS 

HLT 

지시기를 D 토막등록기에 넣기 . 체계조종 
정지 
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표 계속 


LOCK 

ESC 

WAIT 

Pentium 이 LOCK 명 령에 즉시 뒤따로는 명령 이 있으면 이 명 령의 리용을 배제 
하도록 공유기 억기 에 유지를 부탁 

처 리 장치 확장리탈.다음 명 령을 지적 하는 리탈코드는 높은 정 확도옹근수나 류점 
수계산을 진행하는 협동처리장치에 의해 실행된다. 

BUSY# 가 취소될 때까지 대기. BUSY 단자는 협동처리장치가 실행을 끝냈다는 
것 을 알려 주며 이 단자가 비 활성 (비능동)상태 에 있 다는것 을 처 리 장치 가 검 출 
할 때까지 Pentium 프로그람실행을 중지한다. 

보호 

SGDT 

LST 

VERR / VERM . 

전체 서술자표를 기억 

토막한계 . 토막한계 값은 사용자규정 등록기 에 넣 는다. 

읽기 및 쓰기토막을 확증 


캐 쉬 관리 

INVD 

WBINNVD 

INVLPG 

내부케쉬를 지우기 

기억기에 버릴 행들을 써넣은후 내부캐쉬를 지우기 
변환엿 보기 완충기 (TLB) 등록을 무효로 하기 



호출 및 복귀명령 

Pentium II 는 틀호출 및 복귀를 위한 4 가지 명령 즉 CALL , ENTER , LEAVE , 
RETURN 을 가지고 있다. Pentium II 에서는 그림 9-9 를 통하여 이미 고찰한 탄창틀을 
리용하여 틀의 호출 및 복귀를 진행한다. 새로운 틀이 호출되는 경우 다음과 같은 동작 
이 진행된다. 

• 복귀 지 점 (복귀 위 치 )을 탄창에 밀 어 넣 는다. 

• 현재의 틀지시기를 탄창에 밀어 넣는다. 

• 탄창지시기에 틀지시기의 새로운 값을 복사한다. 

• 탄창지시기가 틀을 할당하도록 조정한다. 

CALL 명령은 현재명령지시기값을 탄창에 밀어 넣고 명령지시기에 넣기점의 주소를 넣어 
틀의 넣 기 점 으로 이 행 하게 한다. 8088과 8086콤퓨터 들에 서 틀은 보통 다음의 명 령 렬 들로 
시작한다. 

PUSH EBP 

MOV EBP , ESP 

SUB ESP , space - for-locals 

여기서 EBP 는 틀지시자이며 ESP 는 탄창지시기이다. 80286 과 그후의 를퓨터들에서는 
ENTER 명 령 이 우의 모든 연산을 단일 한 명 령 으로 수행한다. 

ENTER 명령은 콤파일러를 직접 지원할수 있게 만들어 진 명령모임에 속하는 명령 
이다. 이 명령은 Pascal , Cobol , Ada 와 같은 언어에서 겹쌓인 틀의 호출을 지원하는 특 
징도 가지고 있다 (C 혹은 FORTRAN 에는 없다.). 이런 언어들에서는 겹쌓인 틀을 호출 
하는 보다 좋은 방법 들이 있다. ENTER 명 령은 PUSH , MOV , SUB 명 령 에 비 하여 더 적 
은 바이트수의 기억기를 요구하지만 (4 byte 대 6 byte ) 실행시간이 더 길다 (10 박자주기 
대 6박자주기). 결국 이 특징을 추가하는것 이 명 령모임설계가들에게는 좋은 구상을 주는 
것처 럼 보이지만 이것은 처 리 장치의 실현을 복잡하게 만든다. 이 방법에 비해 볼 때 
RISC 방법은 ENTER 와 같은 복잡한 명 령을 피하면서도 보다 단순한 명 령으로 효과적 인 
실현을 기 대 할수 있는 방법 이 다. 
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기억기관리 

명령모임에는 기억기토막과 관련한 특별한 명령들도 있다. Pentium II 에는 오직 조 
작체계로만 실행될수 있는 특권명 령들이 있다. 이 명 령들은 국부적이며 전역적 인 토막표 
(서술자표라고도 한다.)를 꺼내여 읽고 토막의 특권준위를 평가하기 위하여 그것을 검사 
하고 교체하는 역 할을 한다. 

한소편캐쉬와 관련한 특별한 명 령들욘 이미 제 4 장에서 고찰하였다. 

조건 쿄드 

조건코드는 어떤 연산에 의하여 설정되 여 조건분기명 령 에 리용되는 특별한 등록기 
내의 비 트들이다. 이 조건들은 산수 및 비 교연산에 의 하여 설정된다. 대부분 언어 들에서 
비 교연산은 덜 기 연산에서 와 같이 두 연산수를 더 는것 이 다. 덜 기연산과의 차이 점 은 비 교 
연산은 단지 조건코드만을 설정 한다면 덜기연산은 목적연산수에 덜 기결과를 기 억 한다는 
것이다. 

표 9-8 은 Pentium II 에서 리 용되 는 조건코드들을 목록화하여 보여 주고 있다. 매 
조건 혹은 이 조건들의 결합은 조건이행에 리용한다. 표 9-9 는 조건이행조작코드를 정의 
한 조건들의 결합을 보여 주고 있다. 

표 9-8. Pentium II 의 조건코드 


상태 비 트 

이 름 


설명 




산수연산에 이어 제일 

왼쪽 비트자리에서 자리올림 

혹은 자 

C 

자리 올림 

리 내 림 이 있는가를 가리 킨다. 그리고 일부 밀기 및 

회전명령 



에 의해서 수정된다. 




기우성 

산수 및 론리연산결과의 

기우성. 1 은 우수기우성， 0 은 기수 


기우성을 지시 한다. 



A 

보조자리올림 

AL 등록기 를 리 용하는 8 bit 산수 혹은 론리 연산에서 
들사이 자리올림 혹은 자리내 림을 표현한다. 

반바이트 

Z 

령 

산수 및 론리 연산결과가 0 이 라는것을 지 시 한다. 


S 

부호 

산수 및 론리 연산결과의 

부호를 지 시 한다. 


o 

자리 넘 침 

더 하기 와 덜 기 연산후의 

연산자리 넘 침을 지 시 한다. 



이 목록에서 몇가지 흥미 있는 경우를 고찰해 보자. 우선 어느 수가 더 큰가를 결정 
하기 위하여 두 연산수들을 비 교하는 경우를 보자. 이 문제 는 수들이 부호가 있는가 없 
는가 하는데 달려 있다. 실례로 8 bit 의 수 11111111 은 00000000 보다 더 크지만 그것은 
어 디 까지 나 이 두수가 부호 없는 옹근수(255>0) 인 경 우이 다. 그러 나 이 두수를 8 bit 2의 
보수 (_1<0) 로 보면 11111111 이 00000000보다 작다. 이 리하여 많은 아쌤 블리언 어 들은 이 
두 경 우를 구별하기 위하여 두가지 형 태의 용어 를 리 용하고 있 다. 즉 부호 있는 옹근수 
를 비 교하는 경 우에 는《보다 더 작다.》와《보다 더 크다.》를 리 용한다. 또한 부호 없 
는 옹근수로 보는 경우에는 용어《보다 아래》와《보다 우》를 리용한다. 

다음은 부호 있는 옹근수들의 비교에서 생기는 복잡성에 관한 문제이다. 부호 있는 
결과는 다음과 같은 경우에 령보다 크거 나 같게 된다. (1) 부호비트가 령 이고 자리넘 침 이 
없는 경우 ( S =0 AND 0=0)， (2) 부호비트가 1 이고 자리넘침이 있는 경우이다. 이미 
앞에서 고찰한 그림 8-5 는 여러가지 부호 있는 연산들에서 시험된 조건들이 정확히 맞 
는다는것을 보여 준다(문제 9-12 참고). 
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표 9-9. 조건이 행 와 SETcc 명 령 에서 Pentiumn 의 조건 


기 호 

검사조건 

설 명 

A,NBE 

c=o 과 z=o 


우 즉 아래가 아니거나 같다(크다，부호 없음). 

AE , NB,NC 

C=1 


우이거 나 같다. 즉 아래 가 아니 다(크거 나 같다，부호 
없음 ) . 

B , NAE,C 

C=1 


아래 즉 우가 아니거 나 갈다(작다，부호 없음) . 

BE,NA 

C=1 혹은 Z=1 


아래 이거 나 같다. 즉 우가 아니 다(작거 나 같다. 부호 
없 음) . 

E,Z 

Z=1 


갈다. 즉 령 (부호 있음 혹은 부호 없음) 

G,NLE 

[(S=l 과 0=1) 혹은 
(S=0 과 0=0)] 과 [z=o] 

크다. 즉 작지 않거나 갈다(부호 있음). 

GE,NL 

( S 치 과 0=0) 
(S=0 과 0=0 

혹은 

크거나 같다. 즉 작지 않다(부호 있음). 

L,NGE 

( S*l 과 0=0) 
( S =0 과 0=1) 

혹은 

작다. 즉 크지 않거나 갈다(부호 없음). 

LE,NG 

(S=l 과 0=0) 혹은 
(s=o 과 혹은 (Z=l) 

작거나 갈다. 즉 크지 않다(부호 없음). 

NE,NZ 

z=o 


같지 않다. 즉 령이 아니다(부호 없음 혹은 부호 있음 ). 

NO 

NS 

0=0 


자리넘침이 없다. 

s=o 


부호가 없다(부수가 아니다.). 

NP’PO 

P =0 


기우성 이 없다. 즉 기수기우성 

O 

0=1 


자러 넘 침 

P 

P =1 


기우성 즉 우수기우성 

S 

S=1 


부호 (부수이 다.) 


Pentium II 의 MMX 명령 

1996년에 Intel 은 자기의 Pentium 계 렬에 MMX 기술을 받아 들였다. MMX 는 다매 
체 과제 처 리를 위하여 최적 으로 만들어 진 명 령들의 모임 이 다. MMX 에는 단일명 령，다중 
자료 ( SIMD : Single - Instruction , Multiple - Data ) 방식으로 자료를 처리 하는 57 개의 새로 
운 명 령들이 있다. 이 명령들은 더하기 혹은 곱하기와 같은 연산을 다중자료요소에 대하 
여 단번에 수행할수 있다. 매 명 령은 단일박자주기 로 명 령을 실행 한다. 이 고속병 렬연산 
은 MMX 명 령 을 리 용하지 않는 알고리 듬에 비 해 연산속도가 2〜8 배 이 다 [ ATKI 96]. 

MMX 명 령의 리용에서 기본은 다매체프로그람작성 이다. 화상과 음성자료는 8 혹은 
16 bit 와 같은 작은 자료형 으로 된 큰 배 럴로 이루어 지며 한편 일반적으로 명 령은 32 혹 
은 64 bit 자료에서 동작할수 있게 되여 있다. 도형처리기 및 화상에서는 하나의 장면이 
화소 1 들의 배렬(모임)로 구성되며 매 화소 혹은 화소색성분(적，록，청)에 대하여 8 bit 
가 할당된다. 또한 음성표본은 16 bit 로 량자화된다. 일부 3 D 도형 그리기 알고리듬에서는 
기본자료형을 모두 32 bit 로 하고 있다. 이러한 각이한 자료길이에서 병렬연산을 수행하 
기 위하여 MMX 에서는 세가지 새로운 자료형을 정의하고 있다. 매 자료형은 길이가 
64 bit 토서 여러개의 보다 작은 자료마당으로 이루어 졌으며 이 매 마당은 고정소수점옹 
근수를 가진다. 이 자료형들은 다음과 같다. 

• 조임형바이 트: 64 bit 크기 로 묶어 진 8개의 바이 트 


1 픽셀 혹은 화소는 회색준위에 할당되는 수자화상의 가장 작은 요소이다. 등가적으로 화소는 그림의 점행렬표현에 
서 매 개별적인 점들에 해당한다. 
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.임 형 단어 : 64 bit 로 묶어 진 4 개 의 16 bit 단어 
.임형배단어 : 64 bit 로 묶어 진 2개의 32 bit 배단어 


표 9-10 은 MMX 명 령 모임 을 목록화하여 보여 주고 있다. 대부분 명 령들은 바이 
어 혹은 배단어 로 병 렬연산을 수행한다. 실례 로 PSLLW 명 령은 조임형단어연산수에 
4개의 단어 에 대 하여 개 별적 으로 따로따로 왼쪽론리밀기를 수행 한다. PADDB 명 중 
임 형바이트연산수가 입 력되 고 조임형바이 트가 출력되도록 독립적 으로 매 바이 트자 e 
하여 병 렬 더 하기연산을 수행한다. 


표 9-10. MMX 명 령모임 


종류 

명령 

설명 

산 

연 

산 

PADD [ B ， W ， D ] 

포장둥그리기를 가전 조임형 8 byte ， 4 개의 16 bit 단어 
혹은 2개의 32 bit 배단어의 병 렬더 하기 

PADD [ B ， W ] 

포화를 고려 한 더 하기 

PADD [ B ， W ] 

포화를 고려한 부호 없는 더하기 

PSUB [ B ， W ， D ] 

포장둥그리기를 가전 덜기 

PSUBUS [ B , W ] 

포화를 고려한 부호 없는 덜기 

PMULHW 

32 bit 결과에서 설정된 낮은 자리 16 bit 를 가전 4개의 부호 있 
는 16 bit 단어 의 병 렬 곱하기 

PMULLM 

32 bit 결과에서 선정된 낮은 자리 16 bit 를 가전 4개의 부호 있 
는 16 bit 단어의 병렬곱하기 

PMADDWD 

4 개의 부호 있는 16 bit 단어의 병렬곱하기 즉 32 bit 결과의 린 
접쌍들을 서로 더하기 

비 

교 

PCMPEQ [ B ， W ， D ] 

같은가에 대한 병렬비교 즉 결과는 참 ( true ) 이면 1 들의 마스 
크，거 짓 ( false ) 이 면 0 들의 마스크이 다. 

PCMPGT [ B ， W ， D ] 

더 큰가에 대한 병렬비교. 결과는 참이면 1 들의 마스크, 거짓 
이 면 0들의 마스크이 다. 

변 

환 

PACKUSWB 

단어를 부호 없는 포화연산을 하여 바이트로 묶기 

PACKSS [ WB ， DW ] 

부호 있는 포화연산을 하여 단어를 바이트로，배단어를 단어로 
묶기 

PUNPCKH 

[ BW , WD , DQ ] 

PUNPCKL 

[ BW , WD , DQ ] 

MMX 등록기 로부터 높은 자리 바이트，단어 혹은 배단어를 병 렬 
로 풀기 

MMX 등록기 로부터 낮은 자리 바이트，단어 혹은 배단어를 병 렬 
로 풀기 

론리 

연산 

PAND 

64 bit 비트별 론리곱하기 

PNDN 

64 bit 비트별 론리곱하기부정 

POR 

64 bit 비트별 론리더하기 

PXOR 

64 bit 비트별 안맞음론리더하기 

자리 

옮김 

PSLL [ W , D , Q ] 

MMX 등록기 에 서 규정 된 값 혹은 직 접 값으로 조임 형단어，배단 
어 혹은 4배단어의 병렬론러왼쪽밀기 

PSKL [ W ， D ， U ] 

조임형단어，배단어 혹은 4배단어의 병렬론리오른쪽밀기 

PSRA [ W , D ] 고 

조임형단어，배단어 혹은 4배단어의 병렬산수오른쪽밀기 

자료 

전송 

MOV [ D ， Q ] 

MMX 등록기 에 로 또는 MMX 등록기 로부터 배단어 혹은 4 배 단 
어를 이동 

상태 

Mgt 

EMMS 

빈 MMX 상태 








새로운 명령모임의 한가지 특수한 특징은 포화연산의 모임이다. 보통 부호 없는 연 
산에서 자리넘침이 일어 나면 맨 웃자리비트밖으로 나가는 초과비트들은 잘라 버리게 된 
다. 이 것을 포장둥그리 기 ( wraparound ) 라고 한다. 이 와 같이 하면 자르기 영 향으로 두 
입 력연산수보다 더 작은 더 하기 결 과를 낳을수도 있 다. 이 제 16 진수 FOOOh , 3000 h 로 표 
현된 두 단어의 더하기를 고찰해 보자. 


FOOOh = 1111 0000 0000 0000 
+ 3000 h = 1111 0000 0000 0000 

10010 0000 0000 0000 = 2000 h 

만일 이 두수가 영상의 세기를 표현한다면 그때 더하기결과는 두 어두운 그림자의 
결합이 개개의 어두운 그림자보다 더 밝아 지게 한다. 이것은 전형적인 생각밖의 일이다. 
포화연산을 하면 더하기결과에 자리넘침이 생기거나 덜기결과로 내리자리넘침이 발생하 
는 경우 그 결과가 표현할수 있는 값들가운데서 가장 큰 수 혹은 가장 작은 수로 설정된 
다. 앞의 실례에 포화연산을 적용하면 다음과 같이 된다. 

FOOOh = 1111 0000 0000 0000 
+ 3000 h = 0011 0000 0000 0000 
10010 0000 0000 0000 
1111 1111 1111 1111 = FFFFH 

공통적으로 화상응용은 색 이 점 차 희미해 지거 나 색 이 점 차 선명해 지는 영 향을 받 
는다. 이것은 한 장면이 점 차 다른것으로 되여 버리는 결과를 초래한다. 그리하여 두개의 
화상을 무게 평 균으로 합성한다. 

Result_Pixel = A_pixel x fade x B_pixel x (1- fade ) 

이 계산은 A 화상과 B 화상에 있는 매 화소자리에 대하여 수행된다. 영상틀의 계렬이 1 
로부터 0 까지 의 색세 기 값 (8 bit 의 옹근수로써 알맞게 척 도화되 였 다. )을 점 차적 으로 변화 
시키면서 엄어 진다면 그 결과는 화상 A 로부터 화상 B 로 색이 점차 변하게 한다. 

그림 9-10 은 하나의 화소모임을 만드는 단계를 순차적으로 보여 주고 있다. 먼저 
8 bit 의 화소성분들이 MMX 의 16 bit 다중능력을 리용할수 있도록 16 bit 의 요소들로 변환 
된다. 640 x 480 분해능을 리용하며 255 개의 가능한 색세기값들을 모두 리용한다면 그때 
MMX 를 리용하여 실행되는 명 령의 총수는 535 X 10 7 로 된다. MMX 명 령을 리용하지 않고 
이와 같은 계산을 하는 경우에는 1.4 xl 0 1G 개의 명령이 요구된다. 

2. PowerPC 의 연산종류 

PowerPC 에도 많은 연산형들이 있다. 표 9-11 에서는 이 연산종류를 목록화하여 보 
여 주었다. 

법 | 天 Iggg 

PowerPC 는 보통 무조건적 이며 조건적 인 분기능력을 가지고 있다. 조건분기명령블 
은 참인가 거 짓 인가를 판정 하기 위하여 조건등록기 의 한비 트를 검 사하며 연산결과가 0 
인가 0 이 아닌가를 판정하기 위 하여 계수등록기의 내용을 검사한다. 조건분기명 령 에서는 
9 가지 조건들을 리용한다. 계수등록기의 내용이 검사되면 그 등록기의 내용이 검사하기 
전보다 1만큼 감소한다. 이것은 반복순환을 형성하는데서 매우 편리하게 리용된다. 
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분기명령은 또한 분기명령 다음의 위치주소가 련결등록기에 있다는것을 지적할수 있 
다. 련결등록기 에 대 하여서는 제 13 장에서 고찰한다. 이 등록기는 호출 및 복귀 처 리를 쉽 
게 해준다. 


화상 A 




1. 화상 A 와 B 로부터 R 
화소성분들을 바이트로 
분리 


I Ar 3 I Ar 2 T ~ A 7 ir 표 HTI I Br 3 I Br 2 | Brl | BrO ~| 



2 . 화상 A 에서 화상 B 를 덜기 


3 .결과를 색세기값과 곱하기 


4. 화상의 B 화소성 분들을 더 하기 

5. 새 합성화소들을 바이트로 묶기 


[ r 3 | 

r 2 | 

rl | 

r 0 | 

* 

X 

* 

a 

| fade | 

| fade | 

| fade | 

| fade | 

| factexr 31 fadexi 21 fadexrl jjfadeXrO | 

+ 

4 

+ 

+ 

Br 3 

Br 2 

Brl 

BrO 

newr 3 

newr 2 

newrl 

newiO 

、、之、、 \ 


I Ir 3| r 2| 

|rl | r 0 | 


이 연산을 수행하는 MMX 3 드렬: 


pror 

mm 7, mni 7 

movq 

mm 3, fad_val 

movd 

mmO,imageA 

movd 

mml,imageB 

punpckblw 

mm 0, mm 7 

punpckblw 

mml , mm 7 

psubw 

mm 0 ,mml 

pmulhw 

mm 0, mm 3 

padddw 

mm 0 ,mml 

packuswb 

mm 0, mm 7 


: rm n 7 음 령 으로 

;4배로 개선된 색세기값을 넣기 
:화상 A 에서 4개의 붉은색화소넣 기 
:화상 B 에서 4개의 붉은색화소넣 기 
;4의 화소를 16 bit 로 분리 
;4의 화소를 16 bit 로 분리 
;화상 A 에서 화상 B 를 덜기 
:덜기결과를 색세기값과 곱하기 
:결과를 화상 B 와 더하기 
;16 bit 결과를 거 꾸로 바이 트단위 로 묶기 


그림 9-10. 색평면우에서 화상들의 혼합 [ PELE 97] 


널기 및 기억명령 

PowerPC 기본방식에서는 넣기 및 기억명령들만이 기억기위치를 호출하며 산수론리 
연산명령들은 등록기에 의해서만 수행된다. 이것은 축소명령모임콤퓨터 ( RISC ) 의 특성이 
며 이 에 대 하여 서 는 제 2장에 서 구체 적 으로 고찰한다. 
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넣기 및 기 억명 령을 규정하는 두가지 특징들은 다음과 갈다. 

• 자료크기 : 자료는 바이트，반단어，단어 혹은 배 단어의 단위로 전송될수 있다.명 
령들은 다중등록기에로 혹은 다중등록기로부터 바이트렬을 넣거나 기억하는데 리 
용할수 있다. 

• 부호확장 : 반단어 혹은 단어넣기에서는 64 bit 의 목적등록기의 왼쪽에 있는 리용하 
지 않는 비트들을 령 혹은 넣은 량의 부호비트로 채운다. 


제 6 절. 아쎔블리언어 

CPU 는 기계명령을 리해하고 실행할수 있다. 이러한 명령들은 단순히 를퓨터에 기 
억된 2진수들이다. 프로그람작성 자가 직접 기계 어 로 프로그람을 작성하려 고 하는 경우에 
는 2 진자료를 가지 고 프로그람을 작성해 야 한다. 

이 제 단순한 BASIC 명 령 문을 고찰해 보자. 

N = I + J+K 

이 명령문을 기계어로 작성하고 I， J 및 K 에 값 2, 3, 4를 할당한다고 하자. 결과를 그 
림 9-11 자 에 보여 주었 다. 프로그람은 16진수로 표현된 위 치 2()1 에 서 시 작한다. 이 프 
로그람은 다음과 같은 4개의 명 령 으로 구성된다. 

1. 위 치 2()1 의 내 용을 AC 에 넣 기 

2. 위 치 202 의 내 용을 AC 에 더 하기 

3. 위 치 203 의 내 용을 AC 에 더 하기 

4. AC 의 내 용을 위 치 204 에 기 억 


우의 과정 은 오랜 시 간이 걸 리며 오유를 자주 발생하게 되 는 과정 으로 된다. 

이 것을 약간 개선한것 이 2진표기 법 대 신에 16진표기 법 으로 프로그람을 작성하는것 이 
다(그림 9-11 L ). 여 기서는 행의 렬로써 프로그람을 쓰며 매 행 에는 기 억기위치주소와 그 
위 치 에 기 억 되 는 2 진값의 16 진부호가 들어 간다. 이 16 진프로그람을 콤퓨터 에 입 력 시 켜 
매행을 2 진수로 변환하고 지정된 위치에 그것을 기억한다. 

이 16진프로그람보다 더 개선된것은 매 명령에 기호이름을 붙여 리용하는것 이다. 이 
것을 리 용하면 그림 9-11 도 에서 볼수 있는것과 같은 기 호프로그람을 작성할수 있다. 프 
로그람에서 입 력의 매행은 역시 기 억기위치를 표현한다. 매행은 공간적으로 서 로 분리되 
여 있는 세 개의 마당으로 구성된다. 제 일 첫 마당은 기 억기위치 주소를 표현한다. 두번째 
마당은 조작코드 즉 연산종류를 식 별해 주는 세개의 글자기 호로 되 여 있다. 기 억기참조 
명령인 경우는 세번째 마당에 주소를 쓴다. 어떤 위치에 임의의 자료를 축적하기 위하여 
기 호 DAT 로 표현되는 의사명령을 리용한다. 이 명 령은 행 에서 세번째 마당이 첫 마당 
에서 규정한 위치에 기억되는 16진수를 포함한다는것을 지시한다. 

이와 갈은 형태의 입력을 위하여서는 약간 더 복잡한 프로그람이 있어야 한다. 프로 
그람은 입력의 매행을 접수하여 두번째 및 세번째마당을 기초로 2 진수를 발생시키며 그 
것을 첫 마당에서 규정한 위치에 기억해야 한다. 

기 호프로그람을 리 용하면 프로그람을 보다 쉽 게 작성하지 만 다루기 불편한 점 이 아 
직도 적지 않다. 특히 매 단어에 대한 절대주소가 주어 져야 하는데 이것은 프로그람과 
자료를 기 억기의 한 장소에 만 넣을수 있다는것을 의미하며 프로그람을 작성 하기전에 그 
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장소를 알아야 한다는것을 의미한다. 더우기 한 행을 프로그람에 추가하거나 또 한 행을 
삭제하려고 하는 경우에는 반드시 그에 뒤따르는 모든 단어들의 주소를 변화시켜야 한다. 


주소 

101 

102 

103 

104 

201 

202 

203 

204 


주소 

101 

102 

103 

104 

201 

202 

203 

204 


내용 

0010 0010 0000 0001 

0001 0010 00000 0010 

0001 0010 0000 0011 

0011 0010 0000 0100 

0000 0000 0000 0010 

0000 0000 0000 0011 

0000 0000 0000 0111 

0000 0000 0000 0000 

기 


101 LDA 201 

102 ADD 202 

103 ADD 203 

104 STA 204 

201 DAT 2 

202 DAT 3 

203 DAT 4 

204 DAT 0 

t：) 


내용 

2201 

1202 

1203 

3204 


표식 연산 

FORMUL LDA 
ADD 
ADD 
STA 


0002 I DATA 

0003 J DATA 

0004 K DATA 

0000 N DATA 


니 


H) 


그림 9-11. 공식 N = I + J + K 의 계산; 1-2 진프로그람, 
L -16 진프로그람, n - 기 호프로그람, ᄅ-아쎔 블리언어 


이로부터 보다 더 좋은 체계 즉 우리가 일반적으로 많이 리용하는 체계들에서는 기 
호주소를 리용한다. 이와 관련한것을 그림 9-11 H 에 설명 하였다. 매 행은 역시 3개의 마 
당으로 이루어 전다. 첫 마당은 주소마당이지만 여기서는 기호주소를 절대값주소대신 리 
용한다. 일부 행들에는 주소가 없는데 그것은 그 행들의 주소가 앞행의 주소보다 하나 
더 크다는것이 명백히 암시되여 있기때문이다. 

이와 같이 구성되는 언어가 바로 아쌤블리언어이다. 아쎔블리언어로 작성된 프로그 
람(아쌤블리프로그람)은 아쌤블러에 의하여 기계어로 번역된다. 이 프로그람은 앞에서 
이미 론의 한 기 호변환뿐아니 라 기 호주소에 일정한 형의 기 억기주소를 할당하기도 한다. 

아쎔블리언어의 개 발은 를퓨터기술의 진화발전에 큰 영 향을 주었다. 이것은 현재 널 
리 리용되 고 있는 고급언어 의 첫 단계 였 다. 일부 프로그람작성 자들만이 아쌤 블리언어 를 
리용하고 있지 만 모든 를퓨터 들은 아쌤 블리언어 로 프로그람을 작성할수 있게 되 여 있다. 
아쎔 블리언어 는 번역프로그람 혹은 콤파일 러 나 I/O 루린과 같은 체 계프로그람개 발에 많 
이 리용된다. 
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련습문제 

1. 많은 CPU 들은 조임 형 10 진수로 산수연산을 진행한다. 10 진연산규칙 들은 2 진연산 
규칙 들과 류사하지 만 2 진론리 가 리 용되 는 경 우에 는 10 진결과의 개 별적 인 수자들을 
일 부 수정해 야 한다. 

두 부호 없는 수들의 10 진더 하기를 고찰해 보자. 매수가 N 개 의 수자로 구성된 
다면 매수에 4 N 개의 비트들이 있게 된다. 이 두수가 2 진가산기에서 더해 진다. 이 
와 갈은 경 우에 결 과를 수정 하는 단순한 규칙 을 제 기 하시 오. 두수 1698 과 1786 에 
대 하여 우의 형식대 로 더 하기를 진행하시오. 

2. 10 진수 조의 10의 보수는 10 N - X 로 정의된다. 

여기서 JV 은 10 진수에서 수자들의 개수이 다. 10 진덜기를 수행 하는 경우 10의 보수표 
현법의 리용에 대하여 설명하시오. (0736) 10 에서 (0326) 10 을 더는 틀을 설명하시오. 

3. 다음의 계 산을 진행 하는 프로그람을 작성 하고 그것 을 0, 1, 2 및 3주소를 리 용하는 
를퓨터들과 결부시켜 비교하시오. 

X = (A + B X 必 AD - E x F ) 

프로그람작성에서 리용할수 있는 명령들은 아래와 같다. 


0 주소 

1 주소 

2 주소 

3 주소 

PUSH M 

LOAD M 

MOVE (X — Y ) 

MOVE(X — Y ) 

POP M 

STORE M 

ADD(X — X X Y ) 

ADD(X —X + Y ) 

ADD 

ADD M 

SUB 

SUB M 

SUB(X — X - Y ) 

SUB(X — X - Z ) 

MUL 

MUL M 

MUL(X — X X Y ) 

MUL(X — X X Z ) 

DIV 

DIV M 
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4. 2 개의 n 비트명 령 으로 된 명 령모임을 가진 가상적 인 콤퓨터를 생각하자. 첫 비트는 
조작코드를 규정 하며 나머지 비트들은 주기 억 기의 2 n -l 개의 n 비 트단어 들중 하나를 
규정한다. 두개의 명령은 다음과 같다. 

SUBS X : 축적기로부터 위치 X 의 내용을 덜어서 위치 X 와 축적기에 결과를 기 
억 한다. 

JUMP X : 프로그람계수기 에 주소 표 를 넣 는다. 

주기억기의 단어는 명령이나 2 의 보수표기법으로 표현된 2 진수이다. 다음의 연산 
을 어떻게 프로그람화하는가를 규정하면 이 명 령저장고가 합리적으로 완성된다는 
것을 론증하시오. 

자료전송: 위치 표를 축적기에，축적기를 위치 표로 이동 
1-. 더하기: 위치 표의 내용을 축적기에 더하기 
n. 조건분기 
H. 론리더 하기 
ᄆ . I/O 연산 

5. 대 다수 명 령 모임 들운 아무러 한 연산도 수행 하지 않는 명 령 NOOP 를 가지 고 있 다. 
이 명령은 프로그람계수기를 증가시킬뿐 CPU 상태에는 영향을 주지 않는다. 이 명 
령의 리용실례를 만들어 보시오. 

6. CPU 가 틀의 호출 및 복귀 를 관리하는데 탄창을 리 용한다고 하자. 이 때 프로그람 
계 수기 처 럼 탄창의 꼭대 기 를 리 용하면 프로그람계 수기 가 없 어 도 되 겠는가? 

7. 부록 9-1 에서 탄창이 틀의 조종과 같은 목적 을 위하여 CPU 에 의 해서만 리 용되는 
경우에는 명령모임에 탄창지향명령 이 없다는것을 보여 주고 있다. CPU 가 탄창지 
향명령이 없이 임의의 목적에 탄창을 어떻게 리용할수 있는가? 

8. 다음식 들을 뒤 배 치 표기 법 으로부터 사이 배 치 표기 법 으로 바꾸시 오. 

ᄀ . AB + C + D 

ᄂ . AB / CD /+ 

ᄃ . ABCDE 

e . ABCDS f F /+ G - H / >4, 

9. 다음식 들을 사이 배 치 표기 법 으로부터 뒤 배 치 표기 법 으로 바꾸시 오. 

ᄀ . + + E 

l . (A + B ) X (C + D ) + E 
n . (A X B ) + (C X D ) + E 
法 . (A - B ) x(((C - D x E )/ F )/ G ) 公 H 

10. 식 A + B + C 를 디 직 스트러 ( Dijkstra ) 의 알고리 듬을 리 용하는 뒤 배 치 표기 법 으로 
바꾸시오. 그리고 이에 동반되는 계단들을 보여 주시오. 결과가 ( A + B)-C 혹은 
A +( B - C ) 와 같은가? 

11. Pentium II 기본방식은 더 하기 연산후에 10 진보정을 하는 명 령 DAA 를 가지고 있 
다. DAA 는 다음과 갈은 순서 로 명 령 들을 수행한다. 

If (( AL AND OFH) > 9 ) OR (AF = 1) then 




endif 

If (AL > 9 FH ) OR (CF = 1) then 
AL AL + 60 H ; 

CF — 1 ； 

else 

AF— 0 ； 

endif 

《 H 》 는 16 진수를 의미 한다. AL 은 두개의 부호 없는 8 bit 등록기 들의 더 하기결과 
를 가지 는 8 bit 등록기 이 다. AF 는 더 하기 결 과의 비 트 3 으로부터 비 트 4 에 자리 올 
림 이 있는 경우에 설정되는 기발이다. CF 는 비트 7 에서 비트 8 로 자리올림 이 있 
는 경우에 설정되는 기발이다. DAA 명령에 의해 수행되는 기능을 설명하시오. 

12. Pentium II 의 비 교명 령 ( CMP ) 은 목적 연산수에서 원천연산수를 던다. 결과로써 상 
태기발 ( C , P ， A , Z , S , ◦) 을 변화시키지만 연산수의 내용은 변화시키지 않는다. 
이 CMP 명 령 에는 조건이 행 ( Jcc ) 혹은 모임조건 ( SETcc ) 명 령 이 뒤 따르게 된다. 여 
기서 cc 는 표 9-9 에서 목록화한 16 개 조건들중의 하나이 다. 부호 없는 수들의 비 
교에서 론의한 조건들이 정확하다는것을 론증하시오. 

13. 대 다수 극소형 처 리 장치 명 령 모임 들은 조건을 검 사하여 그 조건 이 맞는 경 우에 는 목 
적연산수를 설정하는 명령을 가지고 있다. 그 실례가 바로 Pentium II 의 SETcc , 
Motorola MC 68000 의 See , National NS 32000 의 Scond 이 다. 

이 명령들사이에는 약간의 차이가 있다. 

• SETcc 와 See 는 바이트에 대한 연산만 하며 Scond 는 바이트，단어，배단 
어에 대한 연산을 한다. 

• SETcc 와 Scond 는 참인 경우 옹근수1로 연산수를 설정하고 거짓인 경우에 
는 령 으로 설정 한다. See 는 참이 면 모든 비 트가 1 인 바이 트를 설정 하며 거 
짓이면 모든 비트가 0 인 바이트를 설정한다. 이러한 서로 다른 기능의 우점 
과 결함은 무엇 인가? 


u . 이 명령들에서는 임의의 조건코드기발을 설정하지 않으므로 명령결과의 명시적 
인 시험은 그의 값을 결정할것을 요구하게 된다. 조건코드들이 이 명 령결과로 
설정되여도 되는가를 론의하시오. 

n . IF a > b THEN 과 같은 단순 IF 명령문은 불값을 만드는 수표현법을 리용하 
여 실현할수 있다. 이 표현법은 프로그람의 도달점 에서의 불식의 값을 표현하 
는 흐름조종 방법과는 상반된다. 콤파일러는 다음과 같은 80 x 86 코드로 된 IF 
a>b THEN 을 번 역한다. 


SUB CX , CX 

MOV AX , B 

CMP AX , A 

JLE TEST 

INC CX 

TEST JCXZ OUT 

THEN 


등록기 CX 를 0 으로 설 정 
위치 묘의 내용을 등록기 AX 로 이동 
등록기 AX 의 내 용과 위 치 A 를 비 교 
.公-호 S 이면 건너뛰기 
등록기 ◦표의 내용에 1을 더하기 
CX 의 내용이 령이면 이행 


OUT 


( A > B ) 의 결과는 등록기에 보존된 불값이며 이 결과는 이 문제에서 보여 준 코드 
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흐름만이 아니 라 다른 프로그람에서도 리용할수 있다. 이를 위하여서는 등록기 CX 
를 리용하는것이 편리한데 그것은 많은 분기 및 순환고리조작코드들이 고리내에서 
의 시험에 ◦표 를 리용하기때문이다. 기억기와 실행시간을 단축하는 SETcc 명령을 
리용하여 이 프로그람을 다시 작성 하시 오( 암서 . • SETcc 명 령 외 에 다른 새 로운 
80 x 86 명 령 들은 필 요 없 다. ) . 

H . 다음과 같은 고급언어명령문이 있다고 하자. 

A ： = (B > C ) OR ( D = F ) 

콤파일러는 이 명령문을 다음과 같은 코드로 만든다. 

MOV EAX , B : 위치 B 의 내용을 등록기 EMX 에로 이동 

CMP EAX , G : 등록기 EAX 의 내 용과 위 치 C 를 비 교 
MOV BL , O ; 0이 거짓을 표현한다. 

JLE N 1 : B 호 C 이 면 이 행 

MOV BL , 1 ; 1 이 거짓을 표현 

N 1 MOV EAX , D 

MOV EAX , F 

MOV BH , O 

JNE N 2 

MOV BH , 1 

N 2 OR BL , BH 

기 억 기와 실 행 시 간을 절 약하는 SETcc 명 령 을 리 용하여 이 프로그람을 다시 작성 하시 오. 

14. 부록 9-1 에서 고찰한 사이배 치표기를 뒤배 치표기로 바꾸는 알고리듬을 리용하여 
그림 9-15 의 식을 뒤배치표기법으로 바꾸는 단계들을 보여 주시오. 그림 9-17 과 
류사한 표현을 리용하시오. 

15. 그림 9-16 과 같은 표현법 을 리 용하여 그림 9-17 에 있는 식 을 계 산하시 오. 

16. 그림 9-18 에서 작은끝지면배 치도를 큰끝배 치 도와 같이 번호가 불도록 다시 그리 시 
오. 64 bit 행들로 된 기억기를 왼쪽에서 오른쪽으로，우에서 아래로 바이트들을 목 
록화하여 보여 주시오. 

17. 같은 자료구조에서 큰끝와 작은끝지면배치도를 그리시오. 이때 그림 9-18 의 형식 
과 그 결과에 대한 설명을 리용하시오. 

ᄀ . strcut { 

double i ; "0 x 1112131415161718 

} si ； 

l . struct { 

int i ； "0 x 11121314 

int j ； //0 xl 5161718 

} s 2； 

ᄃ. struct { 

short i : //0 xlll 2 
short j ; "0 x 1314 

short k ； //0 xl 516 
short 1 ; //0 xl 718 

} s 3； 
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18. PowerPC 구성방식명세서는 처리장치가 작은끝방식을 어떻게 실현해야 하는가를 

보여 주지 않는다. 구성방식명세서는 작은끝방식에서 동작할 때 처리장치가 가져야 
할 기억기에 대한것만을 규정하고 있다. 큰끝으로부터 작은끝으로 자료구조를 변화 
시키는 경우 처리장치는 바이 
트교체기구를 자유롭게 실현하 
거 나 일부 주소변경기구를 자 
유롭게 리 용 한다. 현재 
PowerPC 처리장치들은 모두 00 

큰끝방식을 암시적으로 리용하 
며 작은끝방식으로 자료를 취 08 

급하는 경 우에 는 주소변경기 구 
를 리용한다. 10 

이제 그림 9-18 에서 정의한 
구조 s 를 고찰해 보자. 이 그림 
의 오른쪽에 있는 지면배치도 씨 

는 처 리장치에서 참고하는 구 
조 S 를 보여 주고 있다. 구조 S 
가 작은끝방식으로 번역되는 
경우 사실상 기억기배치도는 
그림 9-12 와 같다. 그림 9-12 
를 설명하고 이것이 쉬운 기억 
기배 치방법 이 라는것과 이 방법의 효과성 을 론증하시 오. 

19. 를퓨터 의 끝배 치 성 을 결정하는 하나의 작은 프로그람을 작성 하고 그 결과를 출력 
하시오. 


작은 마무리 주소배지 


11 12 13 14 

00 01 02 03 104 05 06 07 


21 22 23 24 25 26 27 28 

08 09 0 A OB 0 C 0 D 0 E 0 F 


:’ A ’| 31 32 33 34 

10 ! 11 : 12 J 13 ■ 14 15 16 17 


18 19 I 1 A IB 


, IC . I ID : ；3 B ； IF 


20 21 22 23 


61 62 63 64 

24 25 26 27 


그림 9-12. 기 억 기 에서 Power PC 의 
작은 마무리구조 


부록 9-1. 탄창 


1. 탄창 

탄창은 한번에 하나의 요소에만 호출할수 있는 요소들의 질서정연한 모임이다. 여기 
서 탄창의 호출점을 탄창의 꼭대기라고 한다. 탄창의 요소수 혹은 탄창의 길이는 변한다. 
항목들은 탄창의 꼭대기를 통해서만 탄창에 추가되거나 탄창으로부터 제거된다. 이런 리 
유로부터 탄창을 아래로 밀어넣기목록 혹은 후입선출 (LIFO： Last IN-First Out) 목록이 
라고 할수 있다. 

그림 9-13 은 기본탄창연산을 보여 주고 있다. 탄창이 일정한 수의 요소를 포함할 때 
에 는 일정한 수의 점 에서 시 작한다. PUSH 연산은 탄창의 꼭대 기 에 하나의 새 로운 항목 
을 덧붙이며 POP 연산은 탄창으로부터 꼭대기항목을 제거한다. 두 경우에 탄창의 꼭대기 
가 뒤따라 움직 인다. 2개의 연산수를 리용하는 2 진연산(곱하기，나누기 , 더 하기，덜기) 
은 연산수로서 꼭대기 2 개의 탄창항목을 리용하며 이 두 항목을 꺼내고 결과를 탄창에 
밀어 넣는다. 오직 하나의 연산수만을 가지는 연산(론리부정)은 탄창의 꼭대기에 있는 
항목을 리용한다. 이 러한 모든 연산들은 표 9-12 에 개괄하여 보여 주었다. 
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2. 탄창실현 

탄창은 CPU 실현의 한 구성부분으로 되는 쓸모 있는 기억기구조이다. 이미 제 4절에 
서 론의 한 탄창의 한가지 리 용은 틀의 호출 및 복귀 를 관리하는것이 였 다. 탄창은 프로그 
람작성 자에게도 효과적으로 리용된다. 이 에 대 한 실례는 이 절에서 후에 론의하는 식평 
가에서 보기로 하자. 




꼭대기 — * 

I 





꼭대기 —* 

J 


j 

꼭대기 —¥ 

J 




K 


K 


K 

꼭대기 —* 

JXK 


L 


L 


L 


L 


M 


M 


M 


M 






* 


* 




* 




, 




* 




* 

기 준 

• 

기준一 ► 


기준 _ 

- 

기준 

* 


시작 PUSH 후 POP 후 급하기연산후 

그림 9-13. 기본탄창동작 


표 9-12. 탄창지향연산 


연산 종류 설명 

PUSH 一탄창꼭대기에 새로운 요소를 덧붙인다. 

POP 탄창의 득대 기 요소를 제 거한다. 

일원연산 탄창의 목대기요소에 대 한 연산을 수행한다. 꼭대 기요소를 결과로 재배 치한다. 

9 지 d ᅪ 탄창의 목대 기 두 요소에 대 한 연산을 수행한다. 탄창의 꼭대 기 두 요소는 제거된 
1 ᄂ2 ᄂ 다. 연산결과를 탄창의 곡대 기 에 배 치한다. 


탄창의 실 현은 그의 잠재 적 인 능력 을 리용하는데서 한 부분에 지 나지 않는다. 프로 
그람작성자가 리용할수 있는 탄창연산을 만들자면 PUSH , POP 와 같은 탄창지향명령들 
과 연산수로써 득대기 하나 혹은 두개의 탄창요소를 리용하는 연산명 령들이 있어 야 한다. 
이 모든 연산들은 탄창의 꼭대기라고 하는 동일한 위치를 리용하므로 연산수 혹은 연산 
수들의 주소가 암시적이며 따라서 이것은 명령에 포함시킬 필요가 없다. 이 명령들은 제 
9 장 제 1 절 에 서 론의 한 0 주소명 령 들이 다. 

틀의 조종과 같은 목적으로 탄창을 오직 CPU 에 의해서만 리용한다면 명령모임에는 
절대 적 인 탄창지 향명 령 이 없을것 이 다. 이 경 우에도 탄창실현은 탄창요소들을 기 억 하는데 
리 용되는 기 억기위치 들의 모임 이 있을것을 요구한다. 이와 갈은 방법 을 그림 9-14 자 에서 
보여 주고 있다. 그림에서 보는바와 같이 위치들의 블로크가 탄창용으로 주기억기 (혹은 
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가상기억기)에 예약된다. 이 블로크에는 보통 부분적으로 탄창요소들이 차 있게 되며 나 
머지는 탄창성장에 리용할수 있다. 

세 개의 주소가 알맞는 연산을 위하여 필요하게 되며 이 주소들은 보통 CPU 등록기들 
에 기억된다. 

• 탄창지시기 : 탄창의 꼭대기주소를 가진다. 항목이 탄창에 추가되거나 탄창으로부터 제거 
되면 지시기는 탄창의 새로운 꼭대기주소를 가지도록 증가되거나 감소된다. 

• 탄창기준: 예약된 블로크에서 밑바닥위치의 주소를 가진다. 

• 탄창한계 : 예약된 블로크의 다른끝주소를 가진다. 

블로크가 탄창용으로 모두 리용되 였다면 이때 시도되는 PUSH 명 령은 오유를 발생 
한다. 일반적으로 오늘날 대부분의 콤퓨터들에서는 탄창기준이 예 약된 탄창블로크의 제 
일 높은 주소로 되며 그 한계는 낮은 주소끝에 있게 된다. 따라서 탄창은 보다 높은 주 
소로부터 보다 낮은 주소로 성 장한다. 

탄창연산의 속도를 높이기 위하여 꼭대 기의 두 탄창요소들을 그림 9-14 l 에서 보는 
바와 같이 등록기 들에 기 억한다. 이 경 우 탄창지 시 기 는 탄창의 세 번째 요소의 주소를 가 
진 다. 


주기억기 


주기억기 



그림 9-14. 일반적인 탄창구성 
기 억기 내의 전체 탄창，등록기 로 된 2개의 꼭대 기요소 


3. 식평가 

수학식들은 보통 사이배치표기법으로 표현된다. 이 양식에서는 연산자가 연산수들사 
이에 끼우게 된다. 복잡한 식들의 표현에서는 식의 평가순위를 결정하기 위하여 괄호를 
리용한다. 실례 로 a+(b x c ) 는 ( a + b ) x c 와 다른 결과를 준다. 괄호를 매우 적게 리용 
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하기 위하여 연산은 보통 암시적인 우선권을 가진다. 일반적으로 곱하기는 더하기보다 
높은 우선권을 가지며 따라서 a+b x c 는 a+(b X c) 와 같은 결과를 낳는다. 

사 이 배 치 표기 법 과 대 치 되 는 기 술은 역 방향뽑스까 (reverse Polish ) 혹은 뒤 배 치 
( postfix ) 표기법이다. 이 표기법에서는 연산자가 두 연산수의 뒤에 놓인다. 실례를 들면 
다음과 같다. 

ab+ — a+b 

abcx + — a+(bxc) 

ab+cx ，多義 (a+b) Xc 

보는바와 같이 식의 표현이 복잡하지만 이 표기법을 리용할 때에는 우선권이 필요 

없다. 표기법의 우점은 이 양식으로 표현된 식 이 탄창을 리용하여 쉽게 평가된다는것 이 

다. 뒤배치표기법으로 표현된 식은 왼쪽에서 오른쪽으로 주사된다. 식의 매 요소들에는 
다음과 갈은 규칙이 적용된다. 

1. 요소가 변수 혹은 상수인 경우 그것을 탄창에 밀어 넣는다. 

2. 요소가 연산자이면 탄창의 꼭대기 두개의 항목을 꺼내여 연산을 하고 그 결과를 
밀어 넣는다. 

전체 식 이 주사되면 결과는 탄창의 곡대기에 있게 된다. 



탄창 

일반등록기 

단일 등록기 


Push a 

Load G[l]，a 

Load d 


Pushb 

Subtract G[l], b 

Multiply e 


Subtract 

Load G[2], d 

Addc 


Push c 

Multiply G[2], e 

Store f 


Push d 

Add GP], c 

Load a 


Push e 

Divide G[l], G[2] 

Subtract b 


Multiply 

Add 

Store G[l],f 

Divide f 

Store f 


Divide 

Popf 



명령의 개수 

10 

7 

8 

기억기 호출 

10 op + 6 d 

7 op + 6 d 

8 op + 8 d 

그림 9-15. f=(a-b)/(c+d 

< 句의 계 산을 위 한 세 

프로그람의 비교 


이 알고리 듬은 식의 평 가에 매 우 편리한 알고리 듬으로 된다. 따라서 많은 를파일 러 
들이 고급언어의 식을 뒤배치표기법으로 바꾼 다음 기계명령을 만들어 낸다. 그림 9-15 
는 탄창지향명 령 을 리용하여 식 꾼= 位一13)/(0 + (1乂 6)을 평 가하기 위한 기 계 명 령렬을 보 
여 주고 있다. 이 그림은 또한 1주소명령과 2주소명령의 리용에 대해서도 보여 준다. 탄 
창지향규칙 이 마지 막 두 경우에는 리 용되지 않았지 만 뒤배 치표기 법은 기계명 령을 발생시 
키기 위한 안내 자로서 의 역 할을 하고 있다. 탄창프로그람에 서 사건들의 순서 를 그림 
9-16 에 보여 주었 다. 
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입력에서 다음요소를 조사한다. 

연산수이면 그것을 출력한다. 

여는 괄호이면 탄창에 밀어 넣는다. 
연산자인 경우에는 


A+BXC+(D+E)XF 

+bxc+(d+e5 XF 

BXC+(D+E)XF 
KC+ (D+E) XF 
C+(D+E)XF 
H-(D+E)XF 
(D+E)XF 
D+E)XF 
+E)XF 
E)XF 
)XF 
XF 
F 

empty - 

empty 


AB 
AB 
ABC 
ABCX + 

ABCX + 

ABCx +D 

ABCX +D 

ABCX+DE 

ABCX+DE+ 

ABCX+DE+ 

ABCX+DE+F 

ABCX+DE+FX+ 


그림 9-17. 사이배치식을 뒤배치식으로 변환 


단계는 다음과 갈다. 










d 


一 

b 



—■ 

c 


c 

a 


a 

— 

a-b 


a-b 


a-b 


그림 9-16. : 


(a-b)/ 

dxe+c 

( a _ b )/( dxe + c ) 의 계산에서 탄창의 러용 


사이배치식을 뒤배치식으로 바꾸는 처 리는 탄창을 러용하면 매우 쉽다. 다음의 알고리 
듬은 Dijkstra 가 제 안한것 이 다 [ DIJK 63]. 알고리 듬은 사이 배 치 식 을 왼쪽에 서 오른쪽으로 
가면서 주사하여 뒤 배 치 식 으로 전개 하며 주사하면서 출력한다. 


입력 


출력 


탄참 


12 3 1 
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• 탄창의 득대기가 여는 괄호이면 연산자를 밀어 넣는다. 

• 탄창의 꼭대기보다 더 높은 우선권을 가지면(곱하기와 나누기는 더하기와 덜 
기보다 더 높은 우선권을 가진다.) 연산자를 밀어 넣는다. 

• 기 타는 탄창에서 연산자를 꺼내여 단계 4를 반복한다. 

5. 닫는 괄호이면 여는 괄호를 만나게 될 때까지 출구로 연산자를 꺼낸다. 꺼내고 
여는 괄호를 없앤다. 

6. 입구가 더 있으면 단계 1로 간다. 

7. 더 이상 입구가 없으면 남은 연산수들은 탄창에 넣지 않는다. 

그림 9 -17 에서는 이 알고리 듬의 리 용을 설명하였 다. 이 실례를 통하여 탄창에 기초 
한 알고리듬의 능력을 어느 정도 알수 있다. 


부록 9-2. 작은끝, 큰끌，쌍끝배치 


단어안의 바이트와 바이트안의 비트가 어떻게 참조되며 표현되는가를 리해하는것은 
중요한 문제의 하나이다. 부록에서는 먼저 바이트순서화를 고찰하고 그다음 비트순서화 
를 보기로 한다. 

1. 바이트순서화 

끝배 치성의 개념은 Cohen 의 문헌 [ COHE 81] 에서 처음으로 론의되 였다. 바이트에 
대 한 끝배 치성은 여 러바이트스칼라값들의 바이트순서 화와 함께 고찰해 야 한다. 고찰은 
실례를 통하여 하는것이 제일 좋다. 이제 32 bit 의 16 진값 12345678 을 바이트단위의 기 
억기위 치 (바이트위 치)184 에 32 bit 의 단어 로 기 억하는 경우를 보자. 


주소 

184 

185 

186 
187 


1 

12 

"34" 

~56" 

"78" 


주소 

184 

185 

186 
187 


1 

78 _ 

~3A 

12 


값은 4 byte 로 구성 되 는데 맨 아래 자리 (제 일 무게 가 작은)바이 트값이 78 이 고 맨 웃자리 
(제 일 무게 가 큰)바이 트값은 12 이 다. 이 값을 기 억 하는데 는 두가지 방법 이 있다. 왼쪽에 
있는 배치도는 제일 무게가 큰 바이트를 가장 낮은 바이트주소에 넣는다. 이것을 큰끝이 
라고 하며 왼쪽에서 오른쪽으로의 순서 간단히 좌우순서 ( left - to-right order ) 라고도 한 
다. 오른쪽에 있는 배치도는 제일 무게가 작은 바이트를 가장 낮은 바이트주소에 넣는다. 
이것을 작은끝이 라고 하며 오른쪽에서 왼쪽으로의 순서 간단히 좌우순서 ( right - to-left 
order ) 라고도 한다. 2 이와 같은 기억기에로의 바이트배치순서는 산수연산장치에서 산수 
연산을 위 한것 이 다. 주어 진 여 러바이트스칼라값에 대 한 큰끝과 작은끝은 서로 바이트가 
역전된 배치도이다. 


큰끝과 작은끝배 치 라는 말은 Jonathan Swift 가 쓴 ᆻ갈리 버 의 려 행 기 " 제 1편 제 4 장에 서 유래 된것 이 다. 이 말은 
큰 쪽에서 수류탄을 던지는 종족과 작은 쪽에서 수류탄을 던지는 종족사이 종교전쟁을 가리키는 말이다. 
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끝배치성의 개념은 여러바이트실체를 단일한 주소를 가진 단일한 자료항목으로 취 
급해 야 할 경우에 적용되는 개념 이 다. Intel 80 x 86, Pentium II , VAX 와 Alpha 와 같 
은 일부 를퓨터들은 작은끝방식의 기계 이며 IBM System 370/390, Motorola 680 x 0, 
Sun SPARC 와 대 다수 RISC 기계들은 큰끝방식의 기계들이다. 이 러한 사정은 한 끝배 
치형의 기계로부터 다른 끝배치형의 기계로 자료를 전송할 때 그리고 프로그람작성자 
가 여러 바이트스칼라안의 개별적인 바이트 혹은 비트들을 조작하려고 하는 경우에 문 
제가 제기된다. 

끝배치성의 속성은 개별적인 자료단위를 벗어 나지 않는다. 임의의 콤퓨터에서 파일， 
자료구조，배렬과 같은 집합체들은 매개가 다 끝배치성을 가지고 여러자료단위로 구성된 
다. 그러므로 한 격식의 끝배치로부터 다른 격식의 끝배치에로의 기억기블로크의 변환은 
자료구조에 대한 지식을 요구한다. 


Struct{ 


int 

a; 

"0x1112 1314 

word 

int 

pad; 

// 


double 

b; 

"0x2122 2324 2526 2728 

doubleword 

char* 

c; 

/ 八) x3132_3334 

word 

char 

am； 

//’AVB，，’C，，，D’/E，，，F’,’G’ 

byte array 

short 

e; 

"0x5152 

halfword 

int 

f； 

//0x6161_6364 

word 


}s; 


큰끝주소배치 


수소 
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그림 9-18. C 자료구조와 그의 끝배 치 도의 실 례 [IBM 94] 


그림 9-18 은 끝배치성이 어떻게 주소지정과 바이트순서를 결정하는가를 보여 주고 
있 다. 그림 에 서 꼭대 기 에 있는 C 구조는 여 러 가지 자료형 을 가지 고 있 다. 그림 에서 낮은 
부분의 왼쪽에 있는 기억기배치도는 큰끝콤퓨터인 경우 자료구조의 번역결과이며 오른쪽 
아래에 있는 배치도는 작은끝콤퓨터인 경우의 자료구조번역결과이다. 모든 경우에 기억 
기는 64 bit 행의 렬로 된다. 큰끝인 경우 기 억기는 왼쪽에서 오른쪽으로, 우에서 아래로 
전개되며 작은끝인 경우 오른쪽에서 왼쪽으로，우에서 아래로 전개된다. 이 배치도들은 
규칙 이 없이 제멋대 로라는것을 강조한다. 한행안에서 왼쪽에서 오른쪽으로 혹은 오른쪽 
에서 왼쪽으로의 두가지 양식을 모두 리용할수 있다. 이것은 어디까지나 기억기할당과는 
무관계한 묘사와 관련 한 문제 이 다. 이 와 같은 자료구조에 대 한 몇 가지 조사결 과들은 다 
음과 갈다. 
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• 문자렬 분류: 큰끝처 리 장치 는 옹근수정 렬 문자렬 비 교에 서 작은끝방식 보다 고속이 다. 
옹근수 ALU 는 병 렬로 여 러바이 트를 비 교할수 있다. 

• 10 진 /ASCII 인쇄 : 모든 값들을 혼동없 이 왼쪽에 서 오른쪽으로 인쇄할수 있 다. 

• 일치한 순서 : 큰끝처 리 장치는 옹근수와 문자렬을 같은 순위 로 기 억한다(맨 옷자 
리바이트가 먼저 온다.). 

또한 다음과 같은 점에서는 작은끝방식이 더 우월하다. 

• 큰끝처리장치는 32 bit 옹근수주소를 16 bit 옹근수주소로 바꾸는 경우 맨 아래자리 
바이트를 리용하여 더하기를 해야 한다. 

• 작은끝격 식 으로는 보다 더 높은 정 확도의 연산을 수행 하기 가 쉽다. 즉 맨 아래 자 
리 바이트를 찾아서 역 방향으로 옮기지 않아도 된다. 

이와 같은 차이는 그닥 중요하지 않으며 보다 더 중요한것은 끝배치격식의 선택이 
그 이전 기계들에 맞겠는가 하는것이다. 

PowerPC 는 큰 및 작은끝방식 을 모두 지 원하는 쌍끝처 리 장치 이 다. 쌍끝기 본방식 은 
쏘프트웨어개발자들이 다른 기계로부터 조작체계나 응용쏘프트들을 옮길 때 임의의 방식 
을 선정해도 되게 해준다. 끝배치방식은 조작체계가 선정하며 그에 따라 처리가 진행된 
다. 방식이 선택되자마자 뒤따르는 모든 기억기넣기 및 기억은 그 방식의 기억기주소지 
정 모형 에 의 해 규정 된다. 이 하드웨 어 특징 을 지 원하기 위 하여 2 개 의 비 트가 처 리 상태 의 
한 부분으로서 조작체 계 에 의 해 유지 되 는 기 계 상태 등록기 ( MSR ) 에 보존된 다. 한비 트는 
조작체 계 핵심부가 실행 하는 끝배 치방식 을 규정하며 다른 한비트는 처 리 장치의 현재 동작 
방식 을 규정한다. 

2. 비트순서화 

한바이트안의 비트를 순서화하는데서는 다음의 두가지 문제에 직면하게 된다. 

1. 첫 비트를 비트 o 혹은 1로 보는가? 

2. 맨 아래 자리비 트를 바이 트의 가장 작은 무게 를 가진 비 트(작은끝) 혹은 바이 트의 
가장 큰 무게를 가진 비트(큰끝)로 할당하는가? 

이 질문에 대 하여서는 모든 기 계들에서 꼭 갈은 방법으로 대 답할수 없다. 일부 콤퓨 
터들에서는 각이한 상황에 따라서 이 대답이 서로 다르다. 더우기 이것은 한바이트안에 
서 의 큰 혹은 작은끝비 트순서 화와 일 치하지 않는다. 프로그람작성 자는 개 별적 인 비 트들 
을 조작하는 경 우에 이 문제 를 반드시 고려해 야 한다. 

한가지 더 관심해 야 할것은 자료가 비트렬 로 직 렬로 전송될 때 이 다. 이때 개 별적 인 
바이트가 전송된다면 제 일 무게가 큰 비트를 먼저 전송하는가，제 일 무게가 작은 비트를 
먼저 전송하는가 하는 문제 가 생긴다. 설계가는 들어 오는 비트들이 알맞게 조종되는가 
를 확인해 야 한다. 이와 같은 문제는 [ JAME 9 W 참고문헌을 보면 더 잘 알수 있다. 
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제 10 장. 명령모임: 주소화방식과 형식 


기 준등록기 (GPR) 


부호 있는 변위 


기 준등록기 (GPR) 


첨 수등록기 (GPR) 




♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦ 

♦ 명령에서 연산수참조는 연산수의 실지값(직접값)이나 연산수주소에 대한 참조를 포 
함하고 있다. 여 러 가지 주소화방식 들이 각이한 명 령모임 들에 리용되 고 있다. 여 기 
에는 직접 (연산수주소가 주소마당안에 있다.) , 간접 (주소마당이 연산수주소를 가 
지는 위치를 가리킨다.) , 등록기, 등록기간접，등록기값이 연산수주소를 만들도록 
주소값에 더해 지 는 여 러 가지 형 의 변위 등 주소화방식 들이 있 다. 

♦ 명령형식은 명령에서의 지면배치마당을 정의한다. 명령형식설계는 고정 혹은 가변 
길이의 명령길이, 조작코드와 매 연산수참조에 할당된 비트수, 주소화방식의 결정 
방법 등을 비롯하여 복잡하다. 

♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦ 

제 9 장에서는 명령모임 이 무엇을 하는가를 기본으로 고찰하였다. 특히 연산수의 종 
류와 기계명령에 의해 규정되는 연산들을 정의하였다. 이 장에서는 명령의 연산수와 연 
산을 규정하는 방법 을 기 본으로 고찰한다. 우선 연산수의 주소가 어떻게 규정되는가를 
보고 그다음 명령비트들이 어떻게 구성되며 명령의 연산수주소와 연산을 어떻게 정의하 
는가를 고찰한다. 
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제 1 절. 주소화방식 

일반적으로 명령형식에서 주소마당은 상대적으로 작다. 콤퓨터에서는 큰 범위의 주 
기 억 기 (일부 체 계 들에 서 는 가상기 억 기 ) 위 치를 참조하기 위 하여 여 러 가지 주소화기 술을 
리용하고 있다. 이 주소화방식들의 선정에서는 주소범위와 주소화의 유연성，기억기참조 
수와 주소계산에서의 복잡성사이 관계를 잘 알고 합리적 인것을 선택해야 한다. 이 절에 
서는 다음과 갈은 가장 일반적 인 주소화방식들에 대 하여 고찰한다. 

• 직접값 

• 직접 

• 간접 

• 등록기 

• 등록기 간접 

• 변위 

• 탄창 

이 방삭들을 그림 10-1 에 보여 주었다. 이 절에서는 다음과 같은 표기를 리용한다. 

A = 명령에서 주소마당의 내 용 
R = 등록기를 리용하는 명령에서 주소마당의 내용 
EA = 참조한 연산수를 가지는 위치의 유효주소 
( X ) = 위 치 X 의 내 용 

표 10-1 은 매 주소화방식에서 수행되는 주소계산을 보여 주고 있다. 

구체적 인 론의를 하기 에 앞서 다음과 같은 두가지 문제를 간단히 고찰한다. 우선 가 
상적 으로 모든 콤퓨터 구성 방식 들은 우에 서 언급한 주소화방식 들가운데서 하나이 상의 주 
소화방식 을 제 공한다. 이때 에는 조종장치 가 개 별적 인 명 령 들에 서 어느 주소방식 을 리 용 
하고 있는가를 어떻게 알아 내는가 하는 문제가 생긴다. 

이를 위한 여러가지 방법들이 있다. 보통 여러가지 주소화방식에 각이한 조작코드를 
대응시키는 방법，명령에서 하나 혹은 그이상의 비트들을 방식마당으로 리용하는 방법 
등이 있 다. 

다음으로 유효주소 (五 4) 의 해신에 관한 문제이다. 가상기억기가 없는 체계에서 유 
효주소는 주기억기주소 혹은 등록기 로 된다. 이 주소를 실지 물리주소로 바꾸는것은 폐지 
화기구의 기 능이 며 프로그람작성 자에게 는 보이 지 않는다. 


표 10-1. 기본주소화방식 


방식 

알고리듬 

기본우점 

기본부족점 

직접값 

연산수 = A 

기 억 기참조가 없 다. 

제한된 연산수크기 

직접 

유효주소 =A 

단순하다. 

제한된 주소공간 

간접 

유효주소 = ( A ) 

큰 주소공간 

여러 기억기참조 

‘퓽록기 

유효주소 =R 

기 억 기참조가 없 다. 

제한된 주소공간 

등록기 간접 

유효주소 = ( R ) 

큰 주소공간 

외부기억기참조 

변위 

유효주소 = A +( R ) 

유연성이 있다. 

복잡성 

탄창 

유효주소 = 탄창의 정정 

기 억 기참조가 없 다. 

제한된 능력 
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1. 직접값주소화 

가장 간단한 양식의 주소화방식은 연산수가 명령내에 실지로 존재하는 직접값주소화 
방식 이다. 


연산수 = A 

이 방식 은 상수를 정 의하여 리용하거 나 변수들의 값을 초기 화하는데 리 용할수 있 다. 수 
는 2 의 보수양식으로 기 억되며 연산수마당의 제 일 왼쪽에 있는 비트가 부호비트로 리용 
된다. 연산수가 자료등록기 에 넣어 지면 부호비트는 완전자료단어크기 로 확장된다. 

직접값주소화의 우점은 명 령꺼 내기외 에 연산수를 얻는데 기 억기참조를 리용하지 않 
는다는것 이 다. 따라서 명령주기에서 하나의 기억기 나 캐쉬주기를 절약하게 된다. 이 방 
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식의 부족점은 수의 크기가 주소마당의 크기로 제한된다는것이다. 이것은 대부분의 명령 
모임들에서 주소마당이 단어길이에 비해 작기때문이다. 

2. 직접주소화 

이 방식은 매우 단순한 주소화방식으로서 주소마당이 연산수의 유효주소를 포함한다. 

유효주소 = A 

이 기 술은 초기 에 나온 콤퓨터 들에 서 일 반적 으로 리용되 였 으며 지 금도 많은 콤퓨터 
체계 에 적용되 고 있다.이 방식은 하나의 기 억기참조만을 요구 할뿐 특별한 계산은 요구 하 
지 않는다. 이 방식의 명백한 제한성은 제한된 주소만을 리용할수 있다는것이다. 

3. 간접주소화 

직접주소화방식에서는 보통 주소마당의 길이가 단어길이보다 더 작으며 따라서 주소 
범위가 제한된다. 이 문제를 해결하기 위하여 주소마당을 기억기에서의 단어주소로 되게 
하여 차례로 완전한 길이의 연산수주소를 가지게 한다. 이와 같이 주소를 지정하는 방식 
이 간접주소화방식이다. 


유효주소= ( A ) 

이미 앞에서 언급한바와 같이 웃식에서 괄호는 무엇의 내용을 의미하는것으로 해석된다. 
이 방법의 우점은 M>it 의 단어길 이 인 경우 리용할수 있는 주소공간이 2 N 이 라는것 이 다. 
부족점 은 명 령실행 이 연산수를 불러 내 는데 두번의 기 억기참조를 필요로 한다는것 이 다. 
즉 하나는 주소를 엄는것 이고 다른 하나는 그의 값을 얻는것 이 다. 

주소화에 쓸수 있는 단어들의 수가 2 W 이지만 한번에 참조할수 있는 서로 다른 유효 
주소의 수는 2 K 으로 제한된다. 여기서 K 는 주소마당의 길이 이 다. 가상기 억기환경에서 
모든 유효주소위치는 임의의 처리의 페지 0 으로 제한될수 있다. 한 명령의 주소마당이 
작으므로 이것은 페지 0 에서 존재하는 작은 수의 직접주소를 산생한다 (제 한성은 단지 
페지 크기가 2 K 과 같거나 그보다 더 커야 한다는것이다.) . 처리가 가동하면 실지기억기 
에 주소마당이 남도록 페 지 0 에 대 한 참조가 반복된 다. 따라서 간접 기 억 기참조는 많아 
서 2 페 지 가 아니 라 암시 적 으로 한페 지 를 참조한다. 

드물게 리용되기는 하지만 간접주소화에서는 여러 수준 혹은 종속련결된 간접주소화 
방식을 리용한다. 


유효주소 = (... ( A )...) 

이 경 우에 전체 -단어 주소의 한비 트가 간접 기 발( I ) 이 다. 1 bit 가 0 이면 단어는 유효주소를 포 
함하며 lbit 가 1이면 간접적인 다른 수준이 동반된다. 이 방법에는 특별한 우점은 없으며 부 
족점 으로는 연산수를 불러 내는데 필요한 기 억기 참조가 셋 혹은 그이상이 라는것 이 다. 

4. 등록기주소화 

등록기 주소화는 직 접 주소화와 류사하다. 단지 차이 점 은 주소마당이 주기 억 기 주소가 
아니 라 등록기 라는것 이 다. 


유효주소= R 

등록기들을 참조하면 주소마당은 3 혹은 4 bit 로 되며 따라서 이 주소마당을 리용하면 8 
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혹은 16개 의 일 반목적 등록기 를 참조할수 있 다. 

등록기주소화의 우점 은 명 령 에서 작은 주소마당을 요구하며 기 억기참조가 필요 없다 
는것이다. 제 4 장에서 이미 고찰한바와 같이 CPU 내에 있는 등록기를 리용한 기억기호 
출시간은 주기억 기 주소를 리용한 호출시 간에 비 해 훨 씬 작다. 등록기 주소화의 부족점 은 
주소공간이 대 단히 제 한된 다는것 이 다. 

등록기주소화방식 이 명 령모임 에서 자주 리용된다면 그것은 CPU 등록기들이 많은 부 
담을 받는다는것을 말해 준다. 주기억 기위치 에 비 해 등록기는 그수가 제 한되 여 있으므로 
그것 들이 효과적 으로 리 용되 는 경 우에 만 은을 낼수 있 다. 모든 연산수를 주기억 기 로부터 
등록기 로 옮기 면 연산을 즉시 에 수행 하고 주기억 기 로 돌아 오게 되 며 이 때 불필 요한 중 
간계단이 추가된 다. 그대 신 등록기연산수를 다중연산에 리용한다면 그때 에 는 실지 보관 
을 하게 된다. 그 실례 가 바로 계산에서의 중간결과이 다. 이제 2 의 곱하기알고리듬을 
쏘프트웨 어 적 으로 실 현 한다고 하자. 그러 면 그림 8-12 의 흐름도에 서 A 라는 표식 이 붙은 
위 치가 여 러번 참조되며 이것은 주기억기위치가 아니 라 등록기로 실현된다. 

값을 등록기 에 남게 하겠는가，주기억 기 에 기 억 하겠는가 하는 문제 는 어 디 까지 나 프 
로그람작성 자의 권한에 속한다. 오늘날 대 다수의 CPU 들은 아쌤 블리 언어 프로그람작성 자들 
이 효과적 인 집 행 프로그람을 작성할수 있도록 여 러개의 일반목적등록기들을 가지 고 있다. 

5. 등록기간접주소화 

등록기 주소화가 직 접 주소화와 류사한 방식 이 라면 등록기 간접 주소화는 간접 주소화와 
류사한 방식이다. 단지 차이점은 주소마당이 기억기위치 아니면 등록기에 귀착되는가 하 
는데 있다. 따라서 등록기간접주소화방식은 다음과 같이 표시 할수 있다. 

유효주소= ( R ) 

등록기 간접주소화의 우점 과 제 한성 은 기 본적 으로 간접 주소화와 갈다. 이 두 주소화방식 에 
서 주소마당의 주소공간의 제한성은 그 마당을 주소를 가지는 단어-길이위치로 되게 하면 
해 소될 수 있 다. 등록기 간접 주소화는 간접 주소화방식 보다 기 억 기참조를 하나 적 게 한다. 

6. 변우 I 주소화 

매 우 강력 한 주소화방식 은 직 접 주소화와 등록기 간접 주소화의 능력 을 결 합한것 이 다. 
이것은 그 리용상황에 따라 각이하게 이름이 불리워 지고 있지만 그 기본기구는 같다. 
여기서는 변위주소화라고 한다. 


유효주소 = A + ( R ) 

변위주소화는 모든 명령이 2 개의 주소마당을 가진다. 그중에서 적어도 하나는 명시적이여야 
한다. 주소마당에 있는 값 (값 = A ) 은 직접 리용된다. 다른 주소마당 혹은 조작코드에 기초 
한 암시 적 인 참조는 그의 내 용이 유효주소를 만들도록 A 에 더 해 지는 등록기 에 귀 착된다. 
변위주소화방식의 가장 일반적 인 리용에는 다음의 세가지가 있다. 

• 상대주소화 

• 기준-등록기주소화 

• 첨수주소화 

상대주소화 

상대주조지정 에서 암시적 으로 참조되 는 등록기 는 프로그람계 수기 이다. 즉 현재명 령 
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주소는 유효주소를 만들도록 주소마당에 더해 진 다. 주소마당은 이 연산을 위하여 2 의 
보수로 취급된다. 결국 유효주소는 명 령주소의 상대적 인 변위 이 다. 

상대주소화는 제 4장과 제 7장에서 고찰한 국부성의 개념을 리용한다. 대부분 기억기 
참조가 실행중인 명 령과 상대 적 으로 가까이 에 있는 경우에 상대주소화방식 을 리용하면 
명령에서 주소비트를 줄일수 있다. 

기준-등록기주소화 

기준등록기주소화방식에 대한 설명은 다음과 같다. 참조된 등록기는 기억기주소를 
가지며 주소마당은 그 주소로부터의 변위 (보통 부호 없는 옹근수표현 ) 를 가진다. 등록 
기 참조는 명 시 적 이 거 나 암시 적 일 수 있 다. 

기준등록기주소화는 또한 국부적 인 기 억기 참조를 리 용한다. 이것은 제 7 장에서 고찰 
한 토막화를 실현하는 편리한 수단이 다. 이 주소화방식 에서는 일부 단일토막등록기 가 채 
용되여 암시적으로 리용된다. 이때 프로그람작성자는 토막의 기준주소를 가지는 등록기 
를 선정하고 명령으로 그것을 명시적으로 참조해야 한다. 후자의 경우에는 주소마당의 
길이가 K 이고 가능한 등록기의 수가 N 이면 하나의 명령으로 N 개의 2 k 단어중 임의의 
하나만을 참조할수 있다. 

첨수주소화 

이 방식 에 대 한 설명 은 다음과 같다. 주소마당은 주기억기 주소를 참조하며 참조된 
등록기 는 그 주소로부터 의 정 방향변위 를 가진 다. 이 것 은 기 준등록기 주소화방식 과 반대 라 
는것을 강조한다. 첨수주소화에서는 주소마당이 기 억기주소이므로 일반적 으로 기준등록 
기 명 령 에 비해 더 많은 비 트의 주소마당을 가지 게 된 다. 또한 기 준등록기 주소화에 서 쓸 
모 없었던것을 첨수주소화에서는 일부 쓸모 있게 만든것도 있다. 그럼에도 불구하고 유 
효주소를 계산하는 방법은 기준등록기주소화와 첨수주소화에서 갈으며 두 경우에 등록기 
참조는 때로는 명시적이고 때로는 암시적이다 (CPU 형태에 따라서) . 

첨수주소화방식은 반복연산을 수행하는데 효과적으로 리용한다. 실례로 위치 A 로 
부터 시작하여 기억된 수들의 목록을 생각해 보자. 이제 이 목록의 매 요소에 1 을 더한 
다고 하자. 이때에는 우선 매값을 불러 내야 하며 그다음 거기에 1 을 더하고 결과를 다 
시 기 억해 야 한다. 필요한 유효주소의 렬은 목록의 마지막위 치까지의 A , A + 1 ， A + 
2，…이다. 첨수주소화를 리용하면 이것을 쉽게 할수 있다. 즉 값 A 를 명령의 주소마당 
에 기억하고 첨수등록기로 선정된 등록기를 0 으로 초기화한다. 매번 연산이 진행된후에 
는 첨수등록기 가 하나씩 증가된다. 

이와 같이 첨수등록기들은 일반적으로 반복과제를 수행하는데 리용되므로 매번 그것 
을 참조한후에는 그 내용을 증가 혹은 감소시켜야 한다. 이로부터 일부 체계에서는 이것 
을 갈은 명 령주기의 한 부분으로 자동적 으로 수행하는데 이것을 보통 자동첨수주소화라 
고 한다. 만일 어떤 등록기들이 첨수주소화에만 리용된다면 그때 자동첨수주소화가 암시 
적 으로，자동적 으로 진행 될것 이 다. 일 반목적 등록기 들이 리 용된다면 자동첨 수연산은 명 령 
내의 한비트로 이것을 신호해야 한다. 증가형자동첨수주소화는 다음과 같은 식으로 표시 
할수 있다. 


( EA ) - A + - CR ) 

R — ( R ) +1 

일부 콤퓨터 에서는 간접주소화와 첨수주소화를 모두 제 공하며 갈은 명 령 으로 이 두 
방식 을 리용할수 있게 되 여 있다. 여 기 에는 두가지 가능성 이 있다. 즉 첨수주소화를 간 
접주소화의 전 혹은 후에 수행하는것 이 다. 
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첨 수주소화를 간접 주소화후에 수행 하면 뒤 첨 수주소화 ( postindexing ) 라고 한다. 

EA = ( A ) + ( R ) 

우선 주소마당의 내용을 직접주소를 가지고 있는 기억기위치에 호출하도록 리용한다. 그 
다음 이 주소가 등록기값으로 된다. 이 기술은 고정된 형식의 많은 자료블로크들중 어느 
하나를 호출하는데 효과적 으로 리 용할수 있다. 실례 로 이미 제 7 장에서 조작체계 는 모든 
처 리를 위하여 처 리조종블로크를 리용하여 야 한다는것을 서술하였다. 이때 수행되는 연 
산들은 블로크를 조작하는것과는 상관없이 모두 같다. 따라서 블로크를 참조하는 명령의 
주소는 변수지적 자가 처 리조종블로크의 시 작위 치 (값 = A ) 로 된다. 첨수등록기는 블로크 
내에서의 변위를 가진다. 

첨 수주소화가 간접 주소화보다 먼저 수행 되 면 앞첨 수주소화 ( preindexing ) 이 라고 한다. 
EA = (A +( R )) 

주소는 단순히 첨수주소화방식 으로 계산된다. 그러 나 이 경우에는 계산된 주소가 연산수가 
아니라 연산수의 주소이다. 이 기술을 리용한 실례는 여러궤도분기표를 만드는것이다. 프로 
그람의 특별한 지점에서 조건에 따라서 여러 위치들중 어느 하나로 갈라 진다. 주소표는 
위 치 A 로부터 시 작하게 설정된다. 이 표에 첨수를 붙이면 필요한 위 치를 찾을수 있다. 
보통 명 령모임 은 앞 및 뒤첨 수주소화방식 을 가지 고 있지 않다. 

7. 탄창주소화 

탄창은 부록 9-1 에서 정의한바와 같이 위치들의 선형적인 배렬이다. 탄창은 때때로 
아래 로 밀어넣기목록 혹은 후입선출대기렬이 라고도 한다. 탄창은 예 약된 위 치들의 블로 
크이다. 항목들은 임의의 주어 진 시간에 블로크를 부분적으로 채우도록 탄창의 곡대기 
에 덧붙는다. 탄창에서 중요한것은 탄창지시기로서 그의 값은 탄창의 곡대기주소이다. 
탄창의 곡대기 두개의 요소들은 CPU 등록기에 있을수도 있는데 이 경우에 탄창지시기는 
탄창의 제 3의 요소를 참조한다 (그림 9-14 1 ) . 탄창지시기는 등록기에 보존되며 따라 
서 기 억 기 에 서 탄창위 치 에 대 한 참조는 사실 상 등록기 간접 주소이 다. 

탄창주소화방식은 암시적인 주소화방식의 한 형태이다. 기계명령은 기억기참조를 포 
함하지 않지만 암시적으로 탄창의 득대기에서 동작한다. 탄창은 전통적으로 일반성을 띠 
고 리 용되지 않지 만 극소형처 리 장치에서 는 거의나 보편적 으로 리 용되 고 있다. 

제 2 절. Pentium ii 와 PowerPC 의 주소화방식 

1 . Pentium II 의 주소화방식 

이 미 앞에서 본 그림 7-22 를 다시 고찰해 보자. 여 기서는 Pentium II 주소번역 기구가 
토막의 변위인 가상 혹은 유효주소라고 하는 주소를 만들어 내 고 있 다. 토막의 시 작주소 
와 유효주소의 합은 선형주소를 이 룬다. 페 지 화가 리용되 고 있는 경 우에 이 선형주소는 
물리주소가 되도록 폐지번역기구를 거처야 한다. 뒤에서의 론의에서는 이 마지막단계를 
무시하는데 그것은 이것 이 명 령모임 에서 나 프로그람작성 자에게 명백 하기때문이 다. 

Pentium II 는 고급언 어 프로그람을 효과적 으로 실 행 할수 있도록 여 러 가지 주소화방식 
을 가지고 있다. 그림 10-2 에는 주소화방식에 리용되는 하드웨어를 보여 주었다. 참조 
대상인 토막은 토막등록기 에 의해 정해 진다. Pentium II 에는 6개의 토막등록기가 있다. 
이 토막등록기들은 실행의 전후관계와 명령에 따라 알맞게 참조된다. 모든 토막등록기는 
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방식 


직접값 

등록기 연산수 
변위 
기 준 

변위를 가진 기준 
변위를 가진 척도첨수 
첨수와 변위를 가진 기준 
척도첨수와 변위를 가진 기준 
상대 


프로그람작성 자가 볼수 없는 토막서 술자등록기 와 관계 를 가지 는데 이 토막서 술자등록기 
는 토막의 시작주소는 물론 한계 (길이)와 같은 토막에 대한 호출정보를 가지고 있다. 이 
외에도 주소를 만드는데 리용하는 기준등록기와 첨수등록기가 있다. 

표 10-2 는 12 개 의 Pentium II 주소화방식 을 보여 주고 있다. 이 제 부터 이 주소화방 
식들을 차례로 고찰해 보자. 

표 10-2. Pentium II 의 주소화방식 


LA- 선형주소 R - 등록기 

(X)- 표의 내용 B - 기준등록기 

SR - 토막등록기 I - 첨수등록기 

PC - aE 그람계수기 s - 척도인자 

A - 명령에서 주소마당의 내용 


직 접값방식 은 연산수를 명 령안에 포함시 킨다. 이 연산수는 바이 트，단어 혹은 배단 
어자료일 수 있다. 

등록기 연산수방식 에서 는 연산수가 등록기 에 위 치 한다. 자료전송, 산수-론리 연산명 령 
과 같은 일 반명 령 에서는 연산수로 32 bit 의 일 반등록기 ( EAX , EBX , ECX , EDX , ESI , EDI , 
ESP , EBP ) 들중 어느 하나， 16 bit 의 일반등록기 ( AX , BX ， CX ， DX ， SI , DI ， SP , BP ) 들중 어느 하 
나， 8 bit 의 일 반등록기 (쇼氏 ：8쫘 (^，0쫘 쇼1, 표，0^ 00들중 어 느 하나를 리 용한다. 류점 
수연산에 서 64 bit 연산수로는 두개 의 32 bit 등록기 쌍을 리 용한다. 또한 일부 명 령 들에 서 는 
토막등록기 ( CS , DS , ES , SS , FS , GS ) 를 참조한다. 

나머지주소화방식 들은 기 억기위치를 참조한다. 기 억기위치는 토막의 위 치와 토막의 
시작으로부터의 변위를 가지도록 규정되여야 한다. 어떤 경우에는 토막이 명시적으로 규 
정되며 또 어떤 경우에는 토막을 암시적으로 할당하는 단순한 규칙에 의해 규정되기도 
한다. 

변위 방식 에 서 연산수의 변위 ( 그림 10-2 의 유효주소) 는 8, 16 혹은 32 bit 의 변위 로 
서 명 령의 한 부분으로 된다. 토막화에서는 명 령내의 모든 주소가 순수 한 토막내 에서의 
변위를 가리킨다. 변위주소화방식은 일부 콤퓨터들에서만 찾아 볼수 있는데 그것은 이미 
언급한바와 같이 이 방식이 명령의 길이가 길기 때문이다. Pentium II 인 경우에 변위 값은 
32 bit 정도로 되며 따라서 6 byte 의 명령을 만든다. 변위주소화방식은 전역변수를 참조하는 
데 효과적으로 쓸수 있다. 

나머지주소화방식은 명령의 주소부분이 처리장치로 하여금 주소를 찾아 보도록 하는 
간접방식들이다. 기준방식에서는 8, 16혹은 32 bit 의 등록기들중 어느 하나가 유효주소를 
가진다. 이 방식은 등록기 간접주소화방식과 갈다. 


A)+(B) 

A + a + 

+ s + s 
、’, 、—, * 、-, * 
a (b(b (i) (b (i)a 

R)R)R)R)R)R)C) 

xv(s(s(s(s(s(s(p 

_ -I -I -I = = = II 
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변위를 가진 기준 방식에서는 명령이 기준등록기에 더해 지는 변위를 포함하며 기준 
등록기로는 일반목적등록기들중에서 임의의것을 쓴다. 이 방식의 리용을 실례로 들어 고 
찰하면 다음과 같다. 

• 국부변수령역의 시작위치를 지시하는 콤파일러에 리용된다. 실례로 기준등록기는 
대응하는 수속에서 리용하는 국부변수들이 들어 있는 탄창의 시 작위 치를 지적 한다. 

• 요소크기가 2, 4 혹은 8 bit 가 아닌 등록기들에는 배렬내에서의 첨수지정에 리용하 
며 첨 수등록기 를 첨수지 정 에 리용할수 없다. 이 경 우에 변위 는 배 렬의 시 작을 지 
시 하며 기 준등록기 에 는 배 렬 내 에 있는 특별 한 요소에 대 한 변위 를 결정하는 계 산 
결파가 등록된다. 

• 레 코드마당을 호출하는데 리 용된 다. 기 준등록기 는 레 코드의 시 작을 지 시 하며 변위 
는 이 마당에 대한 편위 이 다. 

변위를 가진 척도첨수 방식에서는 명령이 첨수등록기에 더해 지는 변위를 포함하고 
있다. 첨수등록기 로는 ESP 라고 하는 등록기를 제외한 임의의 일 반목적등록기 를 리용할 
수 있다. ESP 는 일반적으로 탄창처리에 리용된다. 유효주소는 첨수등록기의 내용을 척 
도인자 1，2, 4 혹은 8에 곱하고 그 결과에 변위 를 더하여 엄 는다. 이 방식 은 배 럴의 첨 
수화에 매 우 편리 한 방식 이 다. 척 도인자 2는 16 bit 의 옹근수배렬 에 리 용되 며 척 도인자 4 
는 32 bit 의 옹근수 혹은 류점수배 렬에，척 도인자 8은 배정확도류점수배 렬에 리 용된다. 

첨수와 변위를 가전 기준 방식에서는 기준등록기와 첨수등록기의 내용들과 유효주소 
를 이 루는 변위 를 모두 더한다. 기준등록기 로는 임의의 일 반목적등록기를 리 용하며 첨수 
등록기로는 ESP 를 제외한 임의의 일반목적등록기를 리용한다. 이 주소화방식은 탄창틀 
에 대 한 국부배 렬을 호출하는데 리용할수 있다. 이 방식은 또한 2 차원배 렬을 지 원하는 
데 도 리 용할수 있 다. 이 경 우에 변위 는 배 렬의 시 작을 지 시하며 매 등록기 는 1 차원배 렬 
을 조종한다. 

변위를 가진 기준척도첨수 방식에서는 척도인자를 곱한 첨수등록기의 내용과 기준등 
록기의 내용，변위를 모두 더한다. 이 방식은 배렬 이 탄창틀에 기 억되여 있는 경우 효과 
적이다. 이 경우에는 배렬요소들의 길이가 2, 4 혹은 8 byte 로 된다. 이 방식은 또한 배 
렬요소가 2, 4 혹은 8 byte 의 길이를 가지는 경우 2 차원배렬의 첨수지정에 효과적으로 리 
용할수 있다. 

상대주소화방식 은 조종흐름명 령 에 리 용된다. 변위 는 다음명 령 을 가리 키 는 프로그람 
계수기의 값에 더 해 진다. 이 경우에는 변위 가 부호 있는 바이 트，단어 혹은 배단어 값으 
로 취급되며 이 값은 프로그람계수기의 주소를 증가시키거나 감소시킨다. 

2. PowerPC 주소화방식 

대 다수 RISC 롬퓨터 들에 서 와 마찬가지 로 PowerPC 는 Pentium II 와 대 다수 CISC 콤퓨 
터 들과는 달리 단순하면서 도 상대 적 으로 간단한 주소화방식 을 리용한다. 표 10-3 에 서 
보여 준바와 같이 이 방식들은 명 령의 형 에 따라서 편리하게 분류되 여 있다. 

널기/기억주소화 

PowerPC 는 두 대 치되는 주소화방식 인 넣기 및 기 억주소화방식을 가지고 있다 (그림 
10-3) . 간접주소화인 경우 명령은 기준등록기에 더해 지는 16 bit 의 변위를 포함하는데 
이때 기준등록기 로는 임의의 일반목적등록기 를 리용할수 있다. 반대 로 명 령은 새 로 계산 
된 유효주소를 기준등록기에 넣어 그의 현재내용을 갱신하도록 한다. 이 갱신선택은 고 
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리에서 배렬의 첨수지정에 효과적으로 리용할수 있다. 


표 10-3. PowerPC 의 주소화방식 

방식 


알고리듬 




넣 기 /기 억 주소화 


간접 


EA = ( BK ) 

+ D 

간접 첨 수 


EA = ( BR ) + ( IR ) 



분기 주소화 


절대 


EA = I 


상대 


EA = ( PC 

) + I 

간접 


EA = ( L / 

CR ) 



고점 수계 산 


등록기 


EA = GPR 


직접값 


연산수 = I 




류점수계산 


등록기 


EA = FPR 


EA 一 

유효주소 

( X ) - 

표의 내용 

BR 一 

기준등록기 

IR 一 

첨 수등록기 

L / CK - 

련결 혹은 계수등록기 GPR - 

일반목적등록기 

FPR 一 

류점수등록기 

D - 

변위 

I - 

직접값 

PC - 

프로그람계수기 



넣기 및 기 억명령을 리용하는 다른 하나의 주소화방식은 간접첨수지정방식이 다. 이 
방식에서는 명령이 기준등록기와 첨수등록기를 참조한다. 이때 두 등록기들로는 임의의 
일반목적등록기를 리용할수 있다. 유효주소는 두 등록기의 내용을 더 하여 얻 어 진다. 결 
국 기준등록기는 새 로운 유효주소로 갱 신된다. 


334 






















분기주소화 

분기 주소화방식 에 는 세 가지 가 있 다. 절대 주소화방식 을 무조건분기 명 령 에 리 용하는 
경우 다음명령의 유효주소는 명령내에 있는 24 bit 의 직접값으로부터 얻어 진다. 24 bit 의 
값은 맨 아래 자리비 트의 다음에 두개 의 0 을 첨 가하고 부호를 확장하면 32 bit 의 값으로 
된다. 이것은 모든 명령들이 32 bit 의 길이 한계를 차지해야 하기때문이다. 조건분기명령 
인 경우 다음명령의 유효주소는 명령내에 있는 16 bit 의 직접값으로부터 얻어 진다. 16 bit 
의 값은 맨 아래 자리비 트다음에 두개 의 0 을 첨 가하고 부호를 확장하여 32 bit 의 값으로 
확장된다. 

상대 주소화방식 인 경 우에 는 24 bit 의 직 접 값 ( 무조건분기 명 령 ) 혹은 14 bit 의 직 접 값 
(조건분기명 령 )이 절대주소화방식에서와 같이 확장된다. 결과값은 현재명 령과의 상대적 
인 위 치 관계 를 정 의하는 프로그람계 수기 에 더해 진다. 

다른 하나의 조건분기주소화방식은 간접주소화방식 이 다. 이 방식은 다음명령의 유효 
주소를 련결등록기나 계수등록기로부터 엄는다. 이 경우에 계수등록기는 분기명령을 위 
한 주소를 보존하는데 리 용된 다. 이 등록기 는 이 미 앞에 서 설 명한바와 같이 순환고리내 
에서의 계수에 리용되기도 한다. 

옹근수연산인 경우 모든 연산수들은 등록기내에 혹은 명령의 한 부분요소로 포함되 
여야 한다. 등록기주소화방식을 리용하는 경우 원천 혹은 목적연산수로는 일반목적등록 
기들중 어느 하나를 리용한다. 직 접값주소화방식을 리용하는 경우 원천연산수는 명령에 
16 bit 의 부호 있는 량으로서 나타난다. 

류점 수연산에 서는 모든 연산수들이 류점 수등록기안에 있 어 야 하며 등록기주소화방식 
만을 리용할수 있다. 


제3 절. 명령령식 

명령형식은 그의 구성요소의 견지에서 보면 명령비트들의 지면배치를 규정한다고 볼 
수 있다. 명령형식은 반드시 하나의 조작코드와 암시적이든 명시적이든 령 혹은 그이상 
의 연산수를 포함해야 한다. 모든 명시적인 연산수는 제 1 절에서 고찰한 주소화방식들중 
어느 하나를 리용하여 참조된다. 형식에서는 매 연산수에 대한 주소화방식을 암시적으로 
혹은 명시적으로 반드시 지적해야 한다. 대다수 명령모임들에서는 하나이상의 명령형식 
을 리용한다. 

명령형식의 설계는 복잡한 기술이며 현재까지 놀라운 발전을 이룩하였다. 이 절에서 
는 먼저 일부 설계 를 리용하여 기 본설계문제 점 들을 고찰하고 다음절에서 Pentium II 와 
PowerPC 의 명 령형식을 고찰한다. 

1. 명령길이 

명령모임설계에서 대부분 처음에 제기되는 기초적인 문제는 명령형식의 길이에 대한 
것이다. 명령길이를 어떻게 결정하는가에 따라 기억기크기, 기억기조작，모선구조， CPU 
복잡성， CPU 속도 등에 영 향을 주거 나 또 영 향을 받게 된다. 아쌤 블리언어프로그람작성 
자는 알수 있겠지만 명령길이를 어떻게 결정하는가 하는것은 콤퓨터의 능력이나 유연성 
에 큰 영향을 준다. 
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명령 길이를 결정 하는데 서 중요한것 은 강력 한 명령 저 장고의 구축과 기 억 공간을 절 약 
할데 대한 요구를 합리적으로 해결하는것 이 다. 프로그람작성자는 더 많은 조작코드와 연 
산수，더 많은 주소화방식，더 큰 주소범위를 요구한다. 더 많은 조작코드와 연산수가 
보장되면 보다 쉽게 프로그람을 작성할수 있게 된다. 또한 보다 많은 주소화방식은 프로 
그람작성자가 표조작이나 여 러 궤도분기와 갈은 일부 기능들을 실현하는데서 보다 큰 유 
연성을 가진다. 프로그람작성자는 이외에도 더 큰 주기억기를 요구하며 보다 많은 가상 
기억기를 리용하고 더 큰 기억기범위에 대한 주소화를 요구한다. 이와 같은 모든것들(조 
작코드，연산수，주소화방식，주소범위) 은 비트들을 요구하며 따라서 명령길이가 보다 
더 길어 지게 된다. 그러나 길이가 긴 명령은 실행에서 효과적이지 못하다. 실례로 
32 bit 명 령 은 16 bit 명 령 보다 2 배 의 기 억 공간을 차지 한다. 그런 데 효과성 은 2 배 보다 훨 씬 
더 작다. 

이러한 호상관계를 초월하여 다음과 같은것을 고찰해 보자. 명령길이는 기억기전송 
길이 (모선체계에서는 자료모선길이) 와 같거나 그의 배수가 되게 한다. 한편 명령의 꺼 
내기주기동안에는 완전한 (옹근수에 해당하는) 명령이 얻어 지지 않는다. 이것은 기억기 
전송속도와 관련된 다. 즉 기 억기 전송속도가 처 리 장치 속도보다 빠르지 못하기 때 문이 다. 
처리장치가 명령을 불러 내는것보다 더 빨리 명령을 실행할수 있게 되면 기억기의 속도 
가 문제 로 된다. 이를 위 한 한가지 해 결방법은 캐쉬 (제 4 장 제 3 절 참고) 를 리용하는것 
이며 다른 한가지 방법은 보다 짧은 명령을 리용하는것이다. 16 bit 명령은 32 bit 의 명령보 
다 2배나 빠른 속도로 명령을 불러 들일수 있지만 실행에서는 2배정도 빠르지 못하다. 

이 와 같은 상황에서도 명 령길 이는 보통 8 bit 로 리용되는 문자길 이 와 고점수길 이의 
배수가 되도록 하여 야 한다. 이를 위하여 불충분하게 정의된 용어 인 단어 ( WORD ) 라는 
개 념을 리용할수 있다 [ FRAI 83_ 기 억기의 단어길이는 를퓨터구성의 《본성적 이며 고유 
한》단위 로 본다. 보통 단어의 크기는 고점수의 크기 (일 반적 으로 이 둘은 갈다. ) 를 결 
정한다. 단어크기는 또한 기억기전송크기와 같거나 혹은 적어도 그의 옹근수배가 되여야 
한다. 가장 일반적 인 자료의 양식은 문자자료이므로 한 단어는 문자의 옹근수배를 기억 
한다. 한편 여 러문자를 기 억하거 나 한 문자가 단어경 계를 벗 어 나는 경우 매 단어 에는 
쓸모 없는 비트들이 있게 된다. 

2. 비트들의 할당 

앞에서는 명령형식의 길이를 결정하는데 관계되는 일부 인자들에 대하여 보았다. 여 
기서 고찰하는것은 명령형식에서 비트들의 할당을 어떻게 하는가 하는것이다. 이것을 합 
리적으로 할당하는 문제도 역시 복잡한 문제 이 다. 

명령길이가 주어 진 조건에서는 조작코드의 수와 주소화능력사이관계를 합리적으로 
고려하여 비트들을 할당하여야 한다. 조작코드를 길게 하면 (연산의 종류가 많아 진다. ) 
명백히 조작코드마당에 더 많은 비트가 할당되게 된다. 명령형식의 길이가 주어 진 조건 
에서 이것은 주소화에 리용할수 있는 비트수를 감소시키게 된다. 이 문제를 해결할수 있 
는 한가지 흥미 있는 방도는 가변길이조작코드를 리용하는것이다. 이것을 리용하면 조작 
코드길이를 최소로 할수 있다. 그러나 일부 조작코드에 대하여서는 명령안에 추가적인 
비트를 리용하여 추가적인 연산을 규정해야 한다. 고정길이명령에서는 이렇게 하면 보다 
적은 비트들이 주소화에 리용된다. 따라서 이 특징은 보다 적은 연산수와 보다 강력하지 
못한 주소화를 요구하는 명 령들에 리용된다. 

주소화비트들의 리용을 결정하는데는 다음과 같은 인자들이 호상 련관되여 작용한다. 
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• 주소화방식의 수 : 때때로 주소화방식은 암시적으로 지정될수 있다. 실례로 어떤 
조작코드들은 늘 첨수주소화에 만 리용한다. 뿐만아니 라 주소화방식 은 명시적 이여 
야 하며 이때 하나 혹은 그이상의 방식비트들이 요구된다. 

• 연산수의 개수 : 주소의 개수가 작으면 작을수록 보다 길고 보다 다루기 힘든 프 
로그람이 나온다는것은 이미 고찰하였다(그림 9-3). 오늘날 콤퓨터에서 일반적 인 
명령들은 두개의 연산수를 리용하고 있다. 명령에서 매 연산수주소는 그 자신의 
방식지적자를 요구하거나 혹은 이 방식지적자의 리용이 주소마당의 리용으로 제 
한될수 있다. 

• 기 억용등록기 : 콤퓨터는 처 리를 위하여 CPU 안으로 들어 오는 자료를 보존하기 
위한 등록기 들을 반드시 가지 고 있 어 야 한다. 한명 의 사용자만이 볼수 있는 등록 
기 (보통 축적기라고 한다.) 를 리용하는 경우 한 연산수주소는 암시적으로 되며 
따라서 여기에 명령비트를 소비할 필요가 없다. 그러나 단일한 등록기에 의한프 
로그람작성은 불편하며 많은 명령을 요구한다. 여러개의 등록기를 리용하는 경우 
는 몇개의 비트들이 등록기지정에 요구된다. 연산수참조에 등록기를 많이 리용하 
면 할수록 더 적은 비트들이 등록기지정에 리용된다. 많은 연구결과들은 사용자 
가 볼수 있는 등록기의 수가 대체 로 8〜32개 라는것을 보여 주고 있다 [ LUND 77, 
HUCK 83] . 

• 등록기묶음의 수: 많은 콤퓨터들은 하나의 일반목적등록기모임을 가지는데 이 모 
임은 8 혹은 16 개의 등록기들로 구성되여 있다. 이 등록기들은 자료를 기억하거나 
변위 주소화를 위 한 주소를 기 억 하는데 리 용된 다. 최 근에 는 일 반목적 등록기 의 한 
그룹이 아니 라 둘 혹은 그이상의 특별한 묶음들의 집합체 (자료나 변위와 같은) 
방향으로 이것을 실현하고 있다. 이 경 향은 한소편극소형처 리 장치 로부터 초대형 
콤퓨터에 이르기까지 모든 콤퓨터들에서 찾아 볼수 있다. 이 방법의 한가지 우점 
은 명령형식에서 얼마 안되는 비트들을 고정된 수의 등록기기능분할에 리용한다 
는것이다. 실례로 8 개의 등록기로 된 두개의 묶음에서는 매 등록기를 식별하는데 
3 개의 비트만이 요구된다. 그것은 조작코드가 등록기묶음이 참조되고 있다는것을 
암시적으로 지정하고 있기때문이다. 이 방법에도 한가지 부족점 이 있다 [ LUND 77].. 
하나의 일반목적등록기모임을 가지고 있는 S /370 과 같은 체계에서 프로그람작성 
자는 보통 자료 및 변위를 위하여 등록기들을 각각 절반씩 할당하는 규칙을 적용 
하여 고정된 배 치를 유지한다 [ MALL 79] . 

• 주소범위 : 기 억 기참조주소에서 참조할수 있는 주소의 범위는 주소비트의 수에 관 
계된다. 이것은 제한성으로 하여 직접주소화에 드물게 리용된다. 변위주소화에서 
범위는 주소등록기의 길이에 의하여 결정된다. 등록기주소로부터의 큰 변위를 줄 
수만 있다면 주소화가 더 편리 하겠지만 이 렇게 되면 명 령안에 상대적으로 큰 수 
의 주소비트들이 요구된다. 

• 주소립 도 : 등록기 가 아니 라 기 억 기 를 참조하는 주소를 규정 하는 다른 하나의 인 
자는 주소화의 립도이 다. 16 혹은 32 bit 의 단어 를 취 급하는 체 계 에서 주소는 설 
계가의 의도에 따라 한 단어 혹은 한바이트를 참조할수 있다. 바이트주소화는 문 
자조작에 편리하지만 고정된 크기의 기억기인 경우 더 많은 주소비트를 요구한다. 

이상에서 고찰한바와 같이 설계가가 깊이 생각하여 균형을 맞추어야 할 많은 인자들 
이 있다. 여기서 어느 인자를 선택하는가 하는것은 명백하지 않다. 실례로 여러가지 명 
령형식방법들을 비교한 연구 [ CRAG 79] 에는 탄창의 리용，일반등록기, 축적기，기억기 
대 등록기방법들이 포함되 여 있다. 이 실례 에서도 일치한 가설묶음을 리용하면 코드공간 
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이나 실행시간에서의 큰 차이는 없다는것을 알수 있다. 

이제 대표적인 두가지 콤퓨터들에서 이와 같은 여러가지 인자들의 균형을 어떻게 맞 
추는가를 간단히 보기로 하자. 

PDP-8 

일 반용콤퓨터 를 위 한 한가지 가장 단순한 명 령설계 는 PDP -8 의 명 령설계 이 다 
[ BELL 78 b ] . PDP -8 은 12 bit 명 령 을 리 용하며 12 bit 의 단어 로 연산을 한다. 또한 단일 일 
반등록기인 축적 기 도 가지 고 있 다. 

이 설계에는 제한성이 있지만 주소화가 매우 유연하다. 모든 기억기참조는 7 개의 
비트와 2개의 lbit 변경자로 이루어 진다. 기억기는 매 페지가 2 7 = 128 단어로 된 고정길 
이폐지로 분할된다. 주소계산은 0 페지에 대한 참조 혹은 폐지비트에 의해 결정되는 현 
재페지 (이 명 령을 포함하는 페지 ) 에 대한 참조에 기초하여 진행한다. 두번째 수정 자비 
트는 직 접 혹은 간접 주소화중 어 느것 이 리 용되 고 있는가를 지 시한다. 이 두 방식 은 간접 
주소가 폐지 0 혹은 한 페지의 한 단어로 되는 12 bit 의 주소가 되도록 결합하여 리용할 
수 있다. 페지 0 에 있는 8 개의 전용단어들은 자동첨수《등록기들》이 다. 간접 참조가 이 
위치들중의 어느 하나에 의하여 진행되면 앞첨수지정 이 일어 난다. 

그림 10-4 에서는 PDP -8 의 명 령형식을 보여 준다. PDP -8 에는 3 bit 의 조작코드와 세 
가지 형태의 명령이 있다. 조작코드 0 부터 5 까지는 그 형식이 폐지비트와 간접비트를 
포함한 단일주소기 억 기 참조명 령 이 라는것 을 보여 준다. 따라서 6 개의 기 본연산밖에 존재 
하지 않는다는것 을 알수 있 다. 연산범 위 를 확장하기 위 하여 조작코드 7 은 등록기참조 혹 
은 마이크로명 령을 정의 한다. 이 형식 에서 나머지비트들은 추가적 인 연산을 코드화하는데 
리용된다. 이 비트들은 단일명령으로 결합될수 있다. 마이크로명령전략은 이미 DEC 에 의 
하여 PDP -1 에서 리용되고 있으며 PDP -1 은 오늘날 마이크로프로그람콤퓨터들의 선구자로 
되 고 있 다. 조작코드 6은 I/O 연산을 가리 킨다. 이 중에 서 6 개 의 비 트들은 64 개 의 장치 들중 
어느 하나를 선택 하는데 리용되며 3 개의 비트들은 알맞는 I/O 지 령을 규정 한다. 

PDP -8 명령형식은 매우 효과적이다. 이것은 간접주소화, 변위주소화, 첨수주소화를 
모두 지원한다. 조작코드를 확장하면 근사적으로 총 35 개의 명령을 쓸수 있다. 12 bit 길 
이로 명령이 제한되므로 이이상 더 좋게 만들수는 없다. 

PDP-10 

PDP -8 명령모임과의 정확한 대비는 PDP -10 명령모임을 통해서 할수 있다. PDP -10 은 
체계가 프로그람을 쉽게 만들도록 그 기능이 강화된 대규모시간공유체계로 설계되였다. 

명 령모임설계 에 리 용된 설계원리들은 다음과 같다 [ BELL 78 C ]. 

• 직 교성 : 직 교성 은 두 변수가 서 로 독립 이 라는 원리 이 다. 명 령모임 의 문맥 에 서 조 
항은 명 령의 다른 요소들이 조작코드와 독립 이 라는것을 의미한다. 즉 조작코드에 
의 해서 결정되지 않는다는것을 가리 킨다 . PDP -10 설계가들은 조작코드와는 독립적 
인 곡 같은 방법 으로 주소가 계 산된 다는것 을 나타내 는 조항을 리용하여 명 령모임 
을 설계하였다. 이것은 많은 콤퓨터들과는 대조되는것으로서 주소방식은 때때로 
리용되 는 연산자에 암시 적 으로 관계 된 다. 

• 완전성 : 모든 연산자료형 (옹근수，고점 수，실수) 은 완전하면서 도 구별할수 있 
는 연산모임을 가져 야 한다. 

• 직접주소화 : 프로그람작성자에게 기억기조작의 부담을 주는 기준 + 변위주소화는 
리용하지 않고 직 접주소화방식 을 리용한다. 
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이 모든 윈리들은 안전한 프로그람작성의 기본목적을 달성하게 한다. 

기억 기 참조 명령 


| 玉작코■三 | D/I | Z/C | 


2 3 4 5 

입출 구 명령 


| 조작코드 


0 2 3 

그룹 1: 마이 크로명 령 


I 1 1 1 0 II CLA I CLL I CMA I CML I RAR I RAL I BSW I IAC 
0 1 2 3 4 5 6 7 8 9 10 11 


그룹 2:마이 크로명 령 

「1 1 1 1 | CLA I SMA I SZA I SNL I RSS I OSR 1 HLT I 0 1 

0 1 2 3 4 5 6 7 8 9 10 11 


그룹 3: 마이 크로명 령 
I 1 1 1 1 I CLA I MQA I 0 
0 1 2 3 4 5 6 

략어: 

CLA =축적기지우기 
CLL =련결지우기 
CMA =보수축적기 
CML =보수련결 
RMR =축적 기오른쪽회 전 
RAL =축적 기왼쪽회 전 
BSW =바이트교체 
IAC = 축적 기 중가 


MQL 0 0 0 


8 9 10 11 


SMA =_축적기에 대한 건너뛰기 
SZA = 령축적기에 대한 건너뛰기 
SNL = 비령련결에 대한 건너뛰기 
RSS = 역 방향건 너 뛰 기 수감 
OSR =교환등록기와의 론리합 
HLT = 정지 

MQA = 축적기에 곱해지는수 혹은 상넣기 
MQL = 곱해지는수 혹은 상넣기 


그림 10-4. PDP -8 명 령형식 

PDP -10 은 36 bit 단어 길 이 와 36 bit 명령 길이를 가진 다. PDP -10 의 고정된 명령형식을 
그림 10-5 에 보여 주었다. 조작코드는 9 개의 비트를 차지하며 512 개의 연산을 규정할수 
있다. 실지로는 총 365 개의 명령이 정의되여 있다. 대다수 명령들은 2 개의 주소를 가지 
며 이중에서 하나는 16 개의 일반등록기들중 어느 하나이 다. 따라서 이 연산수참조는 4 
개 의 비 트를 차지 한다. 다른 연산수참조는 18 bit 의 기 억 기 주소마당에 서 출발한다. 이 마당 
은 직접값연산수 혹은 기억기주소로서 리용될수 있다. 기억기주소로 리용되는 경우 첨수 
주소화 및 간접 주소화방식 을 리 용할수 있 다. 첨 수등록기 로서 는 일 반등록기 들을 리 용한다. 

36 bit 의 명 령길이는 매우 합리적 이 다. 그림 10-5 에서 보여 준 조작 코드 보다 더 많은 
조작 코드를 가질 필요는 없다. 9 bit 의 조작 코드 마당이면 완전히 충분하다. 주소화 역시 
단순하며 충분하다. 118 bit 의 주소마당이 면 필 요한 직 접 주소화를 모두 실현할수 있 다. 2 18 
보다 기억기크기가 더 큰 경우에는 간접주소화를 리용한다. 또한 프로그람작성자의 편의 
를 도모하기 위하여 표작성 이 나 반복프로그람에 첨 수주소화를 리 용할수 있 다. 18 bit 연산 
수마당을 가지 게 되면 직접 값주소화가 합리 적 인것으로 된 다. 
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간접 비 트 


수기 


8 9 121314 17 18 

그림 10-5. PDP-10 명 령형식_ 


PDP -10 명령모임설계는 초기에 목록화된 대상들에 알맞는다 [ LUND 77]. PDP -10 명령 
모임 은 기 억 공간을 비효과적 으로 리 용하여 소비하므로 프로그람작성 자 혹은 콤파일 러 가 
과제를 쉽게 수행할수 있게 한다. 이것은 설계 가가 만들어 낸 의식적 인것으로서 한심한 
설계 라고는 볼수 없다. 

3. 가변길이명령 

지 금까지 고찰한 실 례 들에 서 는 단일 고정 명 령 길 이 를 리 용하였 으며 명 령 형 식 의 전후관 
계에서 합리적인 방안을 암시적으로 론의하였다. 설계가는 여러가지 길이를 가진 각이한 
명령형식을 제공하는 대신에 그것들을 선택할수도 있다. 이것은 각이한 길이를 가진 조 
작코드의 큰 저장고를 쉽게 엄을수 있다. 주소화는 등록기와 기 억기참조의 각이한 결합 
에 또 주소화방식들을 첨부하면 보다 유연하게 할수 있다. 가변길이명령을 리용하면 이 
와 같은 많은 변량들이 효과적으로 함축되여 주어 질수 있다. 

가변길 이 명 령 은 CPU 의 복잡성 을 증대시 킨다. 하드웨 어가격 이 떨 어 짐 으로써 마이 
크로프로그람(제 4편에서 론의됨 )의 리용이나 CPU 설계원리를 리해하는데 모두 적은 가 
격이 들게 되였다. 

가변길이명령의 리용은 모든 명령의 길이가 단어길이의 옹근수배가 되여야 한다는 
요구를 무시하지 않는다. CPU 는 불러 내야 할 다음명령의 길이를 모르므로 대체로 가장 
긴 명령의 길이와 같은 몇개의 바이트 혹은 단어를 불러 들인다. 이것은 때로는 여러개 
의 명령을 불러 들인다는것을 의미한다. 앞으로 계 11 장에서 고찰하겠지만 이것은 모든 
경우에 알맞는 좋은 전략이 다. 

PDP-11 

PDP -11 은 16 bit 소형를퓨터들의 제한범위에서 강력하고도 유연한 명령모임을 제공 
하도록 설계되였다 [ BELL 70]. 

PDP -11 기는 8개의 16 bit 일반등록기들을 한 묶음으로 가지고 있다. 이 등록기들중에 
서 두개의 등록기는 부가적인 의미를 가진다. 하나는 특별한 목적의 탄창연산에 리용되 
는 탄창지시기 이며 다른 하나는 다음명 령의 주소를 가지는 프로그람계수기 이다. 

그림 10-6 은 PDP -11 의 명 령형식을 보여 주고 있다. 13 개의 서로 다른 명령형식들 
이 있는데 이것들은 0，1，2 주소화명령형식을 취하고 있다. 조작코드는 그 길이가 4 로 
부터 16 bit 까지 변할수 있다. 등록기참조는 길이가 6 bit 이 다. 이중에서 3개의 비트는 등 
록기 를 식 별 하는데 리 용하며 나머지 3 bit 는 주소화방식 을 규정 한다. PDP -11 은 풍부한 주 
소화방식을 가지고 있다. 조작코드가 아니라 연산수로 주소화방식을 련결하는것의 한가지 
우점은 임의의 주소화방식을 조작코드로 리용할수 있는것이다. 이미 언급한바와 같이 이 
독립성을 직교성 이 라고 한다. 


340 






PDP -11 명 령은 보통 긴 하나의 단어 (16 bit ) 이 다. 일부 명 령 에서는 하나 혹은 2개의 
기억기주소가 첨부되여 32 혹은 48 bit 의 명령이 저장고의 한 부분으로 된다. 이것은 주 
소화에서 더 큰 유연성을 보장한다. 

PDP -11 명령모임과 주소화능력은 복잡하다. 이것은 하드웨어의 비용과 프로그람작성의 
복잡성을 증가시 킨다. 우점은 보다 효과적 이며 함축된 프로그람을 개 발할수 있다는것 이 다. 

VAX 

대다수 콤퓨터구성방식은 상대적으로 작은 수의 고정된 명령형식을 준다. 이 명령형 
식은 프로그람작성자들에게 다음과 갈은 두가지 문제를 야기시킬수 있다. 첫째로, 주소 
화방식과 조작코드가 직교하지 않는다는것이다. 실례로 어떤 주어 진 연산에서 한 연산 
수는 등록기，다른 연산수는 기억기이거나 혹은 둘 다 등록기 기타 등으로 되여야 한다. 
둘째로，제한된 수의 연산수들만이 리용될수 있다는것이 다. 즉 둘 혹은 셋까지의 연산수 
를 리용할수 있다. 일부 연산들은 보다 많은 연산수를 요구하므로 여러가지 방법들을 둘 
혹은 그 이상의 명령을 리용하여 필요한 결과를 엄는데 리용해야 한다. 

이 문제 를 풀기 위하여 다음과 같은 두가지 준칙 이 VAX 명 령형식 을 설계하는데 리 
용되였다 [ STRE 78]. 

1. 모든 명 령은《고유하면서도 본성적인》수의 연산수를 가져 야 한다. 

2. 모든 연산수는 그 규정 에서 똑 갈은 일반성을 가져 야 한다. 

이것은 매우 가변적인 명령형식을 낳는다. 명령은 조작코드에 따라 0〜6 개의 연산수지 
적자를 가진 1 혹은 2 byte 의 조작코드로 이루어 진다. 최소명령길이는 lbyte 이며 37 byte 
까지의 명 령을 만들수 있다. 그림 10-7 에 몇가지 실례를 보여 주었다. 

VAX 명령은 한바이트의 조작코드로 시작한다. 한바이트의 조작코드이면 대부분 
VAX 명 령 을 조종하기 에 는 충분하다. 그러 나 300 개 이 상의 각이 한 명 령 이 있 으므로 8 bit 
를 가지고서는 불충분하다. 16 진코드 FD 와 FF 는 두번째 바이트에서 규정되는 실지 조 
작코드와 함께 확장된 조작코드를 지 시한다. 

명령의 나머지부분은 최대로 6 개의 연산수지적자들로 구성된다. 연산수지적자는 왼 
쪽에서부터 4 개의 비트들이 주소방식지적자인 최소 lbyte 형식을 가진다. 이 규칙에 맞 
지 않는 경 우는 문자방식 으로서 이 방식 은 6 bit 의 문자를 위한 공간을 남기 면서 제 일 왼 
쪽에 있는 2개의 비트로 패턴 00을 신호한다. 이와 같은 제외로 인하여 총 12개의 각이 
한 주소화방식 을 규정할수 있 다. 

연산수지적자는 보통 한바이트로 구성되며 여기서 오른쪽 4 개의 비트들은 16 개의 
일반목적등록기들중 어느 하나를 규정한다. 연산수지적 자의 길 이는 두가지 방법들중 어 
느 하나로 확장할수 있다. 첫번째 방법은 하나 혹은 그이상 바이트들의 상수값이 연산수 
지 적 자의 첫 번째 바이 트를 즉시 뒤따르게 하는것 이 다. 이 방법 의 실례 는 변위방식 이며 
이 방식에서는 8, 16 혹은 32 bit 의 변위를 리용한다. 두번째 방법은 첨수방식의 주소화를 
리용하는것이다. 이 경우에 연산수지적자의 첫번째 바이트는 4 bit 의 주소화방식코드 
0100 과 4 bit 의 등록기식별자로 구성된다. 연산수지적자의 나머지부분은 길이가 하나 혹 
은 그이상의 바이트가 될수 있는 기준주소지적자로 된다. 

독자들은 어떤 종류의 명령이 6 개의 연산수를 요구하는가 하고 이상하게 생각하면 
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서 놀랄수 있다. 놀랍게도 VAX 는 얼마간의 이 러한 명령들을 가지고 있다. 이제 명령 
ADDP 6 0 P 1, 0 P 2, 0 P 3, 0 P 4, 0 P 5, 0 P 6 

을 고찰해 보자. 이 명령은 2 개의 조임형 10 진수를 더 하는 명령이다. OP 1 과 OP 2 은 하 
나의 10 진수렬의 길이와 시 작주소를 규정 하며 OP 3 과 OP 4 는 두번째 10 진수렬의 길이 
및 시 작주소이 다. 두개의 10 진렬은 서 로 더 해져 결과가 OP 5 와 OP 6 에 의해 규정 되 는 
길 이 와 시 작위 치 를 가지 는 10 진수렬 에 기 억 된 다. 


16진수형 식 설 명 아쌤 블러 표기와 설명 


8 bits 




ADDL 3 에 대 한 
조작코드 
짧은 문자 5 

R 0 등록기 방식 
R 2 첨 수앞불이 

상대 간접 단어 
( PC ) 로부터의 변위 
위 치 A 에서 상대적으로 
PC 로부터 의 변위량 


ADDL 3#5， R 0，@ A [ R 幻 

5을 R 0 의 32 bit 옹근수에 
대 하여 A 와 R 2 내 용의 4 
배를 더한 위치에 결과를 
기억 


그림 10-7. VAX 명 령의 실례 

VAX 명 령모임은 다양한 연산과 주소화방식 을 가지 고 있다. 이 것은 콤파일작성도구 
와 갈은 프로그람을 개 발하기 위한 매우 강력하면서도 유연한 도구를 프로그람작성 자들 
에게 제공해 준다. 리론적으로 이것은 고급언어프로그람의 효과적인 기계어번역을 실현 
하며 일 반적 으로 효과적 이 며 능률적 으로 CPU 자원을 리용할수 있 게 한다. 이 와 같은 리 
득이 있는 반면에 보다 단순한 명 령모임과 형 식을 가진 처 리 장치 에 비 하면 CPU 의 복잡 
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성 이 증가하는 결함도 있다. 

이에 대한 구체적인 고찰은 제 12장에서 한다. 여기서는 매우 단순한 명령모임인 경 
우만을 대상으로 고찰한다. 

제 4 절. Pentium 11 와 PowerPC 의 명령형식 

1. Pentium II 의 명령형식 

Pentium II 는 각이 한 명 령형 식 을 가지 고 있다. 이 절에서 고찰하는 요소들중에서 조 
작코드마당만은 늘 나타난다. 그림 10-8 에서는 명령형식을 보여 주었다. 명령은 0〜 4 
개 까지 의 선택 적 인 명 령앞붙이，하나 혹은 두바이 트의 조작코드，선택 적 인 주소지 적 자로 
이루어 진다. 여기서 주소지적자는 Mod r/m 바이트，척도첨수바이트，선택적인 변위， 
선택적인 직접값마당으로 이루어 진다. 


Bytes 

0 혹은 1 

0 혹은 1 

0 혹은 1 

0 혹은 1 


명령 

토막 

연산수크기 

주소크기 


앞불이 

무효 

무효 

무효 


-1) 


Bytes 

1 혹은 2 

0 혹은 1 

0 혹은 1 

0, 1, 2 혹은 4 

0, 1, 2 혹은 4 


조작코드 

MOD/RM 

SIB 

변위 

직 접 값 



서 ， \ 

_^ 

I Mod I Reg/OPCDDI 

| R/M 1 

上| 

첨 수 

一! 


그림 10-8. Pentium II의 명령형식 
n- 앞불이, 명령 

먼저 앞붙이바이 트들을 고찰해 보자. 

• 명 령 앞붙이 : 명 령 앞붙이 는 LOCK 앞붙이 혹은 반복앞붙이 들중 어 느 하나로 구성 
된다. LOCK 앞붙이 는 다중처 리 장치환경 에서 공유기억기의 전문리용을 확보하는 
데 리 용된 다. 반복앞붙이 는 Pentium II 가 규칙 적 인 쏘프트웨 어 순환고리 에 서 보다 
훨씬 더 빨리 렬을 처리할수 있게 하는 렬의 반복연산을 규정한다. 여기에는 5 
개 의 서 로 다른 앞붙이 가 있 다. 즉 REP , REPE , REPZ , REPNE 와 REPZ 등이 다. 
절대 REP 앞붙이 가 존재하면 명 령 에서 규정된 연산은 련속되는 렬요소에 대 하여 
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반복실행된다. 반복실행수는 등록기 CX 로 규정한다. 조건 REP 앞붙이는 명령이 
CX 의 내 용이 0으로 될 때 까지 혹은 조건 이 만족될 때 까지 계 속 반복되 게 한다. 

• 토막표시 : 명령이 어느 토막등록기를 리용하는가를 명시적으로 규정한다. 이때 
이 명 령 을 위 하여 발생 되 는 암시 적 인 토막등록기 선택 은 무시 된 다 . 

• 주소크기 : 처 리 장치 는 16 혹은 32 bit 의 주소를 리 용하여 기 억기를 지정할수 있다. 
주소의 크기는 명 령 에서 변위크기를 결정하며 유효주소계산기간에 발생한 주소의 
변위크기를 규정한다. 이 크기들중 하나는 암시적 으로 지적되며 주소크기앞붙이 
는 32 bit 와 16 bit 주소발생 사이 에 서 절 환한다. 

• 연산수크기 : 명 령은 16 혹은 32 bit 의 암시적 인 연산수크기를 가진다. 

또한 연산수앞붙이 는 32 bit 와 16 bit 연산수사이에 서 절 환한다. 

명 령 그자체는 다음과 같은 마당을 포함하고 있다. 

• 조작코드 : 하나 혹은 두바이트의 조작코드. 조작코드는 자료가 바이트크기 혹은 
완전크기 (문맥에 따라 16 혹은 32 bit ) 인 경우와 자료연산의 방향 (기 억기에로 혹 
은 기 억 기 로부터 )，직 접 값자료마당이 부호확장된것 인지 아닌지 를 규정 하는 비 트 
들을 가지고 있다. 

• Modr/m ： 이 바이 트와 그다음바이 트는 주소화정 보를 규정 한다. Mod r/m 바이 트는 
연산수가 등록기 라는것 을 지 정하며 기 억 기 내 에 있는 경 우 바이 트안의 마당들을 
리 용하는 주소화방식 을 규정 한다. Mod r/m 바이 트는 세개의 마당으로 구성 된다. 
Mod 마당 (2 bit ) 은 32 개의 가능한 값들 즉 8 개의 등록기 와 24 개의 첨 수지정 방 
식 을 이 루는 r/m 마당과 결 합한다. Reg/Opcode 마당 (3 bit ) 은 등록기 수를 규정 하 
거 나 3 bit 이상의 마당으로 조작코드정보를 규정 한다. r/m 마당 (3 bit ) 은 연산수 
위 치 로써 등록기 를 지 정할수 있 으며 또 Mod 마당과 결 합하여 주소화방식 의 한 부 
분으로서의 역 할을 한다. 

• SIB ： Mod r/m 바이트의 일정 한 코드화는 주소화방식을 완전히 규정 하는 SIB 바이 
트를 규정한다. SIB 바이트는 3 개의 마당으로 구성된다. SS 마당 (2 bit ) 은 척도 
첨 수주소화를 위한 척 도인자를 규정하며 첨 수마당 (3 bit ) 은 첨 수등록기 를，기 준 
마당 (3 bit ) 은 기 준등록기 를 규정한다. 

• 변위 : 주소화방식 지 적 자가 변위 방식 을 리 용하고 있는 경 우 8, 16혹은 32 bit 의 부호 
있는 옹근수 변위마당을 추가한다. 

• 직 접 값: 8, 16 혹은 32 bit 의 연산수값을 규정한다. 

아래 에서는 여 러 가지 명 령형식의 비 교를 진행한다. Pentium II 형 식 에서 주소화방식 
은 매 연산수에 서가 아니 라 조작코드렬 의 한 부분으로서 주어 지 게 된 다. 주소화방식 정 
보는 하나의 연산수만이 가질수 있으므로 명 령 에서는 하나의 기 억 기 만을 참조할수 있 다. 
그러나 VAX 방식에서는 모든 연산수가 주소화방식정보를 가지고 있다. 이것은 기억기 
대 기억기연산을 가능하게 한다. 결국 Pentium II 명령들은 VAX 명령에 비 해 보다 압축되 
여 있다. 그러나 기억기 대 기억기연산을 해야 하는 경우 VAX 는 이것을 단일한 명령으 
로 실 행할수 있 다. 

Pentium II 형식은 lbyte 만이 아니 라 2 byte 와 4 byte 의 첨수주소화용변위를 리용할수 
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있다. 보다 큰 첨수변위의 리용은 보다 긴 명령을 낳지만 그래도 이 특징은 유연성을 보 
장한다. 실례로 큰 배렬 혹은 큰 탄창을 주소화하는데 쓸모가 있다. 그러나 IBM S /370 
명령형식은 4 Kbyte (12 bit 의 변위정보)보다 더 큰 정보는 허용하지 않으며 변위가 반드시 
정수여야 한다. 위치가 이 변위내에 있지 않는 경우 콤파일러는 요구되는 주소로 범위초 
과코드를 발생 시 킨다. 이 문제 는 4 Kbyte 를 초과하여 차지 하는 국부변수를 가지 는 탄창 
틀로서 취급하면 아주 명백해 진다. 

이상에서 고찰한바와 같이 Pentium II 명 령의 코드화는 매 우 복잡하다. 코드화는 8086 
를퓨터와 역 방향호환성 이 보장되여 야 한다는 요구 그리고 효과적 인 코드를 만들도록 콤 
파일 러작성 도구에 서 모든 가능한 방조를 제 공할데 대 한 일 부 설 계 가들의 요구를 만족시 
키 도록 부분적 으로 해 야 한다. 이 와 같이 복잡한 명 령모임 을 RISC 명 령모임 의 상반되 는 
극단으로 보는것 이 오히 려 더 좋은지는 론의해 보아야 할 문제 이 다. 

2. PowerPC 의 명령형식 

Power PC 의 모든 명령은 32 bit 길이를 가지며 규칙적 인 형식을 가지고 있다. 명령에 
서 첫 6 개의 비 트들은 수행 되 는 연산을 규정한다. 일부 경 우에는 연산의 특별한 부분경 
우를 규정 하도록 명 령밖으로 조작 코드를 확장한다. 그림 10-9 에 서 그늘진 부분은 조작 코 
드비 트를 표시한다. 

명령형식의 규칙적인 구조는 명령실행장치의 일감을 덜어 준다. 모든 넣기/기억 및 
산수연산과 론리연산명 령 들에 서 조작코드는 32 개 의 일 반목적 등록기 를 리 용할수 있도록 
두개 의 5 bit 등록기참조를 동반하게 된 다. 

분기명 령은 분기명 령 에 뒤따르는 명 령의 유효주소가 련결등록기 에 있다는것을 지시 
하는 련결 ( L ) 비트를 포함하고 있다. 두 양식의 명 령은 주소화방식 이 절대주소화방식 인 
가 혹은 프로그람계 수기 상대 방식 인가를 지 시하는 비 트 ( A ) 를 가지 고 있 다. 조건분기 명 
령에서 CR 비트마당은 조건등록기 에서 검 사되는 비 트를 지정한다. 선택 마당은 분기 가 어 
떤 조건하에 서 취 해 지 는가 하는 조건을 규정한다. 조건에 는 다음과 갈은것 들이 있 다. 

• 늘 분기 

• 계수값이 0이 아니고 조건이 거짓 이면 분기 

• 계 수값이 0 이 아니 고 조건이 참이 면 분기 

• 계 수값이 0 이 고 조건이 거 짓 이 면 분기 

• 계수값이 0이고 조건이 참이면 분기 

• 계 수값이 0이 아니 면 분기 

• 계수값이 0이면 분기 

• 조건이 거짓이면 분기 

• 조건이 참이면 분기 

계산(산수연산，류점수연산，론리연산 등)을 진행하는 대다수 명령들은 연산결과를 
조건등록기에 기록하겠는가를 지시하는 하나의 비트를 가지고 있다. 이 특징은 분기예측 
처리에 효과적으로 리용할수 있다. 
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류점수명 령은 세개의 원천등록기를 위한 마당을 가지 고 있다. 많은 경우 2 개의 원 
천등록기만을 리용한다. 몇 가지 명 령들은 두 원천등록기의 곱하기를 진행 하고 세번째 원 
천등록기의 더 하기 혹은 덜기를 진행한다. 이 복합명 령들은 갈은 형의 연산이 계속 반복 
되여 진행되는 경우에 리용된다. 실례로 행렬연산의 한 부분인 내부적의 계산은 곱하기 
一더하기를 리용하여 실현할수 있다. 
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련습 문제 

1. 32 bit 명령이 16 bit 명령에 비해 쓸모가 2 배도 되지 않는다는것을 론증하시오. 

2. 다음과 같은 기 억기값과 축적기를 가진 1 주소콤퓨터 가 주어 진 경우 다음명 령들은 
축적기에 어떤 값을 넣는가? 

• 단어 20은 40을 가지 고 있 다. 

• 단어 30은 50을 가지 고 있 다. 

• 단어 40은 60을 가지 고 있 다. 

• 단어 50은 70을 가지 고 있 다. 

ᄀ . LOAD IMMEDIATE 20 

l . LOAD DIRECT 20 
ᄃ . LOAD INDIRECT 20 
ᄅ . LOAD IMMIDIATE 30 
n . LOAD DIRECT 30 
U . LOAD INDIRECT 30 

3. 프로그람계수기에 기억된 주소가 기호 XI 로 표시된다고 하자. XI 에 기억된 명령 
은 주소부분 (연산수참조) X 2 를 가진다. 명 령실행 에 요구되는 연산수는 주소 X 3 에 
기억기단어로 기억된다. 첨수등록기는 값 X 4 를 가지고 있다. 이와 같은 경우 명령 
주소화방식이 자-직접, L - 간접， c-PC 상대， H - 첨수인 경우 이 여러가지 량들사 
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이 관계는 어떻게 되겠는가? 

4. PC 상대 방식의 분기명 령은 주소 620 1() 기 억기 에 기 억되 여 있다. 이 분기명 령 에 의하 
여 위치 530 10 으로 이행한다. 명령내의 주소마당은 lObit 로 길다. 명령내에서 그의 
2진수값은 얼마인가? 

5. 간접주소화방식의 명령을 불러 내여 실행할 때 그 명령이 단일연산수를 요구하는 
계산명령(가)이거나 분기명령 (L) 이라면 CPU 는 기억기참조를 몇번 요구하는가? 

6. IBM370 은 간접 주소화방식 을 가지 고 있지 않다. 연산수의 주소가 주기억 기 에 있 다 
고 가정하면 연산수를 어떻게 호출하는가? 

7. IBM 이 왜 단어단위 를 36bit 로부터 32bit 로 바꾸었는가? 

8. 참고문헌 [COOK8 幻 에서는 탄창리용을 비 롯한 다른 주소화방식 에 유리하도록 PC 상 
대주소화방식을 배제 한다는것을 제 안하고 있다. 이 제 안의 부족점은 무엇 인가? 

9. 고정된 16bit 명령길이를 리용하는 명령모임이 있다고 하자. 연산수는 길이가 6 bit 
이 다. 또한 k 개의 두 연산수명 령과 L 개의 령-연산수명 령 이 있다. 하나의 연산수를 
가진 명령의 최대수는 얼마인가? 

10. 다음의 모든 명 령 들이 36 bit 의 명 령 으로 부호화되 도록 가변길 이 조작코드를 설계하 
시오. 

• 두개 의 15 bit 주소와 한개 의 3 bit 등록기 번호를 가진 명 령 

• 하나의 15 bit 주소와 하나의 3 bit 등록기 번 호를 가진 명 령 

• 주소나 등록기 를 가지 지 않는 명 령 

11. 문제 9-3 의 결과를 고찰해 보자. 보 이 16bit 기 억 기 주소이 고 X， Y 와 Z 가 16bit 주 
소 혹은 4bit 등록기 주소라고 가정 하자. 한바이 트주소콤퓨터 는 축적 기 를 리 용하여 2, 
3 주소콤퓨터를 16 개의 등록기 와 기 억기위치 및 등록기 들의 모든 결합으로 동작하 
는 명 령 들을 가진 다. 조작코드의 길 이 는 8bit 이 고 명 령 길 이 가 4 의 배 수라고 가정 하 
면 매 명령은 X 를 계산하는데 몇 비트를 요구하는가? 

12. 2개의 조작코드를 가진 명령 이 있다면 어떤 정당성 이 가능한가? 

13. Pentium II 는 다음과 같은 명령을 가지고 있 다. 

IMUL OP1 ， OP2 ，직접값 

이 명령은 등록기나 기억기가 될수 있는 OP2 에 직접값을 곱하고 그 결과를 OP1 
에 넣 는데 OP1 은 등록기 여 야 한다. 명 령 모임 에 는 이 부류에 속하는 다른 3 연산수 
명령은 없다. 이러한 명령을 리용할수 있는 가능성은 무엇인가? (암시 : 첨수지정을 
생각해 보시오.) 
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제 11 장. CPU 구조와 기능 



♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦총 

♦ 처 리장치는 사용자가 볼수 있는 등록기들과 조종 및 상태등록기 들을 가지고 있다. 사 
용자가 볼수 있는 등록기들은 기계명령에서 암시적으로 혹은 명시적으로 참조될수 
있다. 사용자가 볼수 있는 등록기들은 고점수 혹은 류점수，주소，첨수，토막지시기 
등과 같은 일 반목적 이 나 전용으로 리 용할수 있 다. 조종 및 상태 등록기 는 CPU 의 연산 
을 조종하는데 리용된다. 대표적인 실례가 프로그람계수기이다. 다른 하나의 실례는 
여 러 가지 상태 및 조건비 트들을 가지 는 프로그람상태단어 ( PSW ) 이 다. 이 것 들은 마 
지막산수연산결과를 반영하는 비트들과 새치기가능비트들, CPU 가 체계관리자 혹은 
사용자방식으로 동작하고 있다는것을 보여 주는 지시기를 포함한다. 

♦ 처리장치는 실행속도를 높이기 위하여 명령관흐름처리를 리용한다. 관흐름처리는 
명령주기를 여러개의 개별적인 단계로 갈라 놓은것을 말하는데 이 개별적인 단계는 
다음과 같은 순서로 일어 난다. 즉 명령꺼내기，명령해신，연산수주소결정，연산수 
꺼내기，명령의 실행，연산수결과의 쓰기와 같은 순서로 단계화된다. 명령은 조립관 
흐름에서와 같이 이 단계를 거치게 되며 원리적으로 매 단계는 같은 시간에 서로 
다른 명령을 수행할수 있다. 분기의 발생과 명령들사이 의존성은 관흐름의 설계와 
리용을 복잡하게 만든다. 

♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦ 
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이 장에서는 제 3편에서 아직까지 고찰하지 못한 처 리장치의 개념을 보고 제 12 장과 
제 13 장에 서 RISC 와 슈퍼 스칼라구성 방식 을 론의 하기 위 한 단계 를 설정 한다. 

이 장에서는 처 리장치구성에 대한 개괄로부터 시작한다. 그다음 처 리장치의 내부등 
록기를 이루는 등록기들을 분석한다. 명 령주기 에 대 한 고찰에서는 그 단계들과 관흐름처 
리 로서 알려 진 일 반기 술을 기 본으로 고찰한다. 마지 막으로 Pentium II 와 Power PC 조직 에 
대한 개념을 고찰한다. 


제 1 절. 처리장치조직 

CPU 의 조직 을 리 해 하기 위 하여 그것 이 해 야 할 일 인 CPU 에 대 한 요구를 고찰해 
보자. 

• 명령꺼내기 : CPU 는 기억기로부터 명령을 읽는다. 

• 명령해석 : 명령은 그것이 어떤 작용을 요구하는 명령인가를 결정하도록 해신된다. 

• 자료꺼내기 : 명령의 실행은 기억기 혹은 I 八)모둘로부터 자료를 읽을것을 요구한다. 

• 자료처리 : 명령의 실행은 자료에 대한 일부 산수 및 론리연산을 수행할것을 요구 
한다. 

• 자료쓰기 : 실행결과는 기억기 혹은 I/O 모둘에 자료를 쓸것을 요구한다. 

이와 같은 일을 하자면 CPU 가 일부 자료를 림시 로 기 억해 야 한다. CPU 는 다음명 
령을 어디에서 엄을수 있도록 마지막명령의 위치를 기억해야 한다. 또한 명령이 실행되 
고 있는 동안 명령과 자료를 림시로 기억해야 한다. 다시말하여 CPU 는 작은 내부기 억기 

그림 11-1 은 체계모선을 통하여 
체계의 나머지부분과 련결을 보장하 
는 CPU 의 간략화된 구성을 보여 
주고 있다. 이미 제 3 장에서 서 술한 
이와 류사한 대면부는 임의의 호상 
련결구조에서 보편적인것으로 되고 
있다. 독자들은 CPU 의 기본구성요 
소들이 산수-론리연산장치와 조종장 
치 라는것 을 상기할수 있 다. ALU 는 
실지 자료의 계산이나 처리를 한다. 
조종장치는 CPU 의 안으로 혹은 밖 
으로 자료나 명령의 이동을 조종하 
며 ALU 의 연산을 조종한다. 그림 
11-1 은 이외에도 이른바 등록기라고 
하는 기 억기위치들의 묶음으로 이 루 
어 지는 최소내부기억기를 보여 주 
고 있다. 

CPU 에 대 한 약간 더 상세한 고찰은 그림 11-2 에 서 보여 주고 있 다. 자료전송 및 론 
리 조종 경 로들이 표시 되 여 있 으며 내 부 CPU 모선이라고 하는 요소도 있 다. 내 부 CPU 모 
선은 각이한 등록기 들과 ALU 사이의 자료전송을 위 한것 이 다. 이것은 사실상 ALU 가 내 
부 CPU 기억기에 있는 자료에 대해서만 연산을 하기때문이다. 그림 11-2 에서는 또한 


를 가져 야 한다. 



그림 11-1. 체계모선을 가진 CPU 
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Ll-2. 




4 장에서 이미 론의한 바와 같이 를퓨터체계는 기억기계층을 리용하고 있다. 기억기 
느는 계층의 보다 높은 준위에서 더 빠르며 크기가 더 작고 비트당 더 많은 비용이 
: PU 안에는 기 억기계층내 에 주기억기와 캐쉬 이상의 기 억 기준위의 기능을 수행 하는 
류음이 있 다. CPU 안에 있는 이 등록기 들은 다음과 같은 두가지 기 능을 수행한다. 

사용자가 볼수 있는 등록기 : 이 등록기들은 기계어 혹은 아쎔블리언어프로그람작 
성 자가 등록기 리용을 최적화하여 주기 억기 참조를 최소로 되게 한다 
조종 및 상태등록기 : 이 등록기들은 CPU 의 연산을 조종하는 조종장치 나 프로그 
람의 실행을 조종하는 특권조작체계프로그람에 의하여 리용된다. 

라 갈은 기능을 수행하는 두 종류의 등록기들을 정확히 구별하기는 힘들다. 실례 
I 일부 콤퓨터들에서 프로그람계수기는 사용자가 볼수 있는 등록기로 되지만(례로 


다른 많은 콤퓨터들에서 


방 









1. 사용자가 볼수 있는 등록기 

사용자가 볼수 있는 등록기는 CPU 가 실행하는 기계어에서 참조할수 있는 등록기이 
다. 이 등록기들은 다음과 같이 분류할수 있다. 

• 일반등록기 

• 자료등록기 

• 주소등록기 

• 조건코드등록기 

일반등록기들은 프로그람작성 자에 의 하여 여 러 가지 기능을 수행 하도록 할당되는 등 
록기이다. 때때로 명령모임에서 이 등록기들은 연산과는 독립적으로 리용된다. 즉 임의의 
일반등록기는 임의의 조작코드에 대한 연산수로 리용한다. 이것이 정확한 일반등록기의 
리용이다. 그러나 보통은 제한이 있다. 실례로 류점수 및 탄창연산인 경우 전용등록기들 
을 리용한다. 

일부 경우에 일반등록기들은 주소지정기능 (례를 들어 등록기간접，변위주소지정 ) 에 
리용할수도 있다. 또 어떤 경우에는 자료등록기들과 주소등록기들사이의 부분적 인 혹은 
완전한 분리를 할수 있다. 자료등록기들은 자료를 유지하는데만 리용될수 있으며 연산수 
주소계산에 리용할수는 없다. 주소등록기들은 일부 일반등록기로 리용되기도 하며 특별 
한 주소지정방식에 전용으로 쓰이기도 한다. 주소등록기에는 다음과 갈은것들이 있다. 

• 토막지시기 : 토막주소지정 (제 7 장 제 3절 참고) 을 가진 콤퓨터에서 토막등록기 
는 토막의 기준주소를 가진다. 여기에는 여러개의 등록기들이 있을수 있다. 실례 
로 조작체계를 위한 토막등록기와 현재처 리를 위한 토막등록기 등을 들수 있다. 

• 첨 수등록기 : 이 등록기 들은 첨 수주소지 정 에 리 용되거 나 자동첨 수지 정 에 리 용한다. 

• 탄창지시기 : 사용자가 볼수 있는 탄창주소지정 인 경우 탄창은 기 억기 내 에 있게 
되며 이 탄창의 꼭대기를 지시하는 전용등록기가 있다. 이것은 암시적인 주소지정 
을 할수 있게 한다. 즉 밀어넣기 와 밀어꺼 내 기 기 타 다른 탄창명 령 들은 탄창연산 
수를 명시적으로 가질 필요가 없다. 

여기서도 론의해야 할 여러가지 설계문제점들이 있다. 중요한 문제점의 하나는 일반 
등록기들을 충분히 리용하며 또 그 리용을 전문화해야 한다는것이 다. 앞의 장에서 이미 
이 문제를 고찰하였다. 그것은 이 문제 가 명 령 모임 설계 에 영 향을 주기때 문이 다. 일 반적으 
로 전문화된 등록기를 리용하게 되면 어떤 연산수지정자가 어떤 형의 등록기에 귀착되는 
가를 조작코드내에서 암시적으로 보여 줄수 있다. 연산수지정자는 모든 등록기들중의 어 
느 하나를 규정하는것 이 아니 라 전문화된 등록기 묶음중의 어 느 하나를 식 별 하면 되 므로 
따라서 비트가 절약된다. 다른 한편 이 전문화는 프로그람작성자의 유연성을 제한한다. 
이 설계 문제 점 에 대 하여서 는 최 종적이 며 가장 좋은 해 결 방도가 없다. 그러 나 이 미 언급 
한바와 같이 전문화된 등록기들을 리용하는것 이 하나의 추세로 되고 있다. 

다른 하나의 설 계문제 점 은 일 반등록기，자료등록，주소등록기 등의 개 수이 다. 이 것 
역시 등록기가 많을수록 더 많은 연산수지정자비트를 요구하므로 명령모임설계에 영향을 
준다. 이 문제 에 대 해서도 이미 론의 한것 처 럼 8〜32사이의 값을 선택 하면 필요한 등록기 
수의 최 적값을 얻 을수 있 다 [ LUND 77]. 등록기 수가 작으면 작을수록 기 억 기참조가 보다 
많이 일 어 나며 등록기수가 많아 진다고 하여 기 억 기참조가 현저 히 줄어 드는것은 아니 
다 ( [ WILL 90] 참고) . 그러 나 수백 개 의 등록기 를 리 용하여 특성 을 개 선하려 는 방법 은 
RISC 체계 에서 받아 들인것으로서 이 에 대해서는 제 12장에서 고찰한다. 
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마지막설계문제점은 등록기길이에 대한것이 다. 주소를 보존해야 하는 등록기들은 명 
백히 가장 큰 주소를 유지하는데 충분한 길이를 가지고 있어야 한다. 자료등록기는 대다 
수 자료형에 따르는 값을 가질수 있어야 한다. 일부 콤퓨터들에서는 두개의 린접등록기 
들을 2배 길 이의 값을 보존하는 하나의 등록기 로서 리 용될수 있게 한다. 

적어도 부분적으로나마 사용자에게 보일수 있는 마지막부류의 등록기들은 조건코드 
(기 발이라고도 한다. ) 를 가진다. 조건코드는 CPU 하드웨 어 에 의 해 연산결과로 설정 되 
는 비 트들이다. 실례 로 산수연산은 정수，부수，령 혹은 자리넘 침결과를 발생 시킬수 있다. 
등록기 혹은 기억기에 기억되는 이러한 결과외에도 다른 하나의 조건코드가 또한 설정된 
다. 이 코드는 조건분기연산의 한 부분으로서 그다음에 검 사된 다. 

조건코드비트들은 하나이상의 등록기들에 집 합된다. 보통 이것들은 조종등록기의 한 
부분을 이룬다. 일반적으로 기계명령들은 이 비트들을 암시적인 참조로 읽는다. 프로그람 
작성자는 이 비트들을 변화시킬수 없다. 

일부 콤퓨터에서 보조루린호출은 사용자가 볼수 있는 모든 등록기들의 자동적인 보 
관을 진행하는데 이 것은 복귀 에서 그것 을 회 복하여 쓰기 위 해서 이 다. 보관과 회 복은 호 
출과 복귀명 령의 한 부분으로서 CPU 에 의하여 수행된다. 이것은 매 보조루린들이 사용 
자가 볼수 있는 등록기들을 독립적으로 리용할수 있게 한다. 그러나 일부 콤퓨터들에서 
는 이와는 달리 보조루린을 호출하기에 앞서 관계되는 사용자가 볼수 있는 등록기들의 
내 용을 대 피 시키는것 이 프로그람작성 자가 해 야 할 일로 되 고 있는것도 있다. 즉 프로그 
탐내에 대피를 위한 명령이 포함되게 된다. 

2. 조종 및 상태등록기 

CPU 의 연산을 조종하는데 리 용되 는 CPU 의 등록기 에는 여 러 가지 가 있 다. 대 부분 콤 
퓨터들에서 이 등록기들은 사용자가 볼수 없다. 이 등록기들중 일부만이 조종 혹은 조작 
체계방식에서 집행되는 기계명령에서 볼수 있다. 

물론 각이 한 콤퓨터들은 서 로 다른 등록기조직을 가지며 또 각이 한 전문용어를 리용 
한다. 여기서는 간단한 서술과 함께 합리적이며 완전한 등록기형의 목록을 보기로 한다. 

명령실행에서는 다음의 네가지 등록기가 기본이다. 

• 프로그람계수기 ( PC ) : 불러 들일 명령의 주소를 가진다. 

• 명령등록기 ( IR ) : 제일 마지막으로 불러 들인 명령을 가진다. 

• 기 억 기 주소등록기 ( MAR ) : 기 억 기 에 서 그 위 치 주소를 가지 다. 

• 기억기완충등록기 ( MBR ): 기억기에 씌여 질 자료단어 혹은 제일 마지막으로 읽 
은 단어를 가진다. 

PC 는 늘 실행할 다음명 령 을 지시하도록 매 명 령을 불러 들인후 CPU 에 의하여 그 
내용을 갱신한다. 분기 혹은 건너뛰기명령에 의해서도 PC 내용이 수정될수 있다. 불러 들 
인 명 령은 IR 에 넣 어 져 여기 에서 조작코드와 연산수지정 자가 해석된다. 자료는 MAR 와 
MBR 를 리용하여 기 억기 에서 교환된다. 모선-구성 체 계 에서 MAR 는 주소모선에 직접 련 
결되 며 MBR 는 자료모선에 직 접 련결된다. 사용자가 볼수 있는 등록기 들은 차례 로 MBR 
와 자료를 교환한다. 

우에 서 언급된 4 개 의 등록기 들은 CPU 와 기 억 기 사이 자료이 동에 리 용된다. CPU 내 에 
서 자료는 처 리를 위 하여 ALU 에 들어 간다. ALU 는 MBR 와 사용자가 볼수 있는 등록 
기들에 직접 호출할수 있다. ALU 와의 경계에는 추가적인 완충등록기들이 있는데 이 등 
록기 들은 ALU 의 입 구 혹은 출구로 작용한다. 또한 이 등록기 들은 MBR 와 사용자가 볼 
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수 있는 등록기들과의 자료교환에도 리용한다. 

모든 CPU 설계 에서 는 프로그람상태 단어 ( PSW ) 로 잘 알려 진 등록기 혹은 등록기 묶 
음설계 가 동반된다. 이 PSW 는 조건코드와 기 타 상태정 보를 가진다. PSW 의 공동마당 혹 
은 기 발들은 다음과 갈다. 

• 부호 : 마지막산수연산결과의 부호비트를 가진다. 

• 령 : 결과가 0일 때 설정된다. 

• 자리올림: 연산결과 자리올림 (더하기)이 생기거나 자리내림 (덜기)이 생겼을 때 
설정 된다. 여 러 단어 산수연산에 리 용한다. 

• 같다 : 론리비교결과가 갈을 때 설정된다. 

• 자리넘침 : 산수연산의 자리넘침을 지시하는데 리용된다. 

• 새치기가능/불가능 : 새치기를 가능 혹은 불가능하게 하는데 리용된다. 

• 체 계관리 자 : CPU 가 체 계관리 자 혹은 사용자방식 으로 동작하고 있는가를 가리 킨 
다. 일부 특권명령들은 체계관리자방식에서만 집행되며 어떤 기억기령역은 체계관 
리자방식에서만 호출할수 있다. 

CPU 설계 에서 는 조종 및 상태 와 관련한 여 러개의 다른 등록기설계도 진행 한다. PSW 
외에도 추가적 인 상태 정 보를 가지 는 기억 기 블로크 ( 처 리 조종블로크 ) 에 대한 지 시 기 가 있 
다. 벡 토르화된 새 치기를 리 용하는 콤퓨터 들에서는 새 치기벡 토르등록기를 장비 하고 있다. 
탄창을 일정한 기능(보조루린호출)을 실현하는데 리용하는 경우 체계탄창지시기가 리용 
된다. 페지표지시기는 가상기 억기체계 에 리용된다. 마지막으로 등록기들은 I/O 연산의 조 
종에도 리용할수 있다. 

여러개의 인자들이 조종 및 상태등록기조직의 설계에 관여한다. 한가지 기본문제는 
조작체계지원이다. 보통 일정한 형의 조종정보는 조작체계에서의 특별한 응용을 위해서 
이 다. CPU 설계 가가 조작체 계의 기 본적 인것을 리해 하고 있다면 등록기조직 을 어 느 정도 
까지는 조작체계에 맞출수 있다. 

다른 한가지 기본설계문제는 등록기와 기억기사이 조종정보의 할당이다. 기억기의 
가장 낮은 위 치의 100〜1000단어정도는 조종목적 에 전용으로 리용되는것 이 일반적 이 다. 
설계 가는 얼마나 많은 조종정보를 등록기 나 기 억기 에 두어 야 하는가를 판단하여 야 한다. 
결국 비용 대 속도의 합리적 인 방도를 찾아야 한다. 

3. 극소형처리장치의 등록기조직에 대한 실례 

여러 체계들의 등록기조직에 대한 고찰과 함께 그 호상비교는 등록기조직을 리해하 
는데서 의의를 가진다. 이 절에서는 대략 같은 시기에 설계된 2 개의 16 bit 극소형처리장 
치 인 Motorola MC 68000 [ STRI 79] 과 Intel 8086 [ MORS 78] 에 대 하여 고찰한다. 그림 11_3 1 
와 11-3 느는 이 처리장치들의 등록기조직을 보여 주고 있다. 그림에서는 기억기주소등록 
기와 갈은 순수 내부등록기들은 보여 주지 않았다. 

MC 68000 은 32 bit 의 등록기들을 8개의 자료등록기와 9개의 주소등록기로 나눈다. 8 
개의 자료등록기는 기본적으로 자료조작에 리용되며 또 첨수등록기로서 주소지정에 리용 
되기도 한다. 등록기들의 너비는 8，16 혹은 32 bit 의 자료연산을 할수 있게 되여 있으며 
이 것은 조작코드에 의해 결정된다. 주소등록기 는 32 bit 의 주소를 가진다. 주소등록기들중 
2 개는 탄창지시기로 리용된다. 두개의 탄창지시기에서 하나는 사용자용으로，다른 하나 
는 조작체계용으로 리용된다. 이 등록기들에는 7 이라는 번호가 붙어 있는데 그것은 한번 
에 하나만을 리용할수 있기때문이다. MC 68000 은 또한 32 bit 의 프로그람계수기와 16 bit 
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의 상태등록기를 가지고 있다. 


자료등록기 일반등록기 일반등록기 



Motorola 연구집 단은 특별 한 목적 을 위 한 등록기 들을 쓰지 않는 매 우 규칙 적 인 명 령 
모임을 설계하는것을 목표로 하였다. 이러한 코드효과성에 대한 관심은 등록기들을 2 개 
의 기본구성요소들로 분할할수 있게 하였다. 이렇게 하면 매 등록기지정자에서 한비트를 
절약하게 된다. 이것은 코드의 일반성을 보장하면서도 코드를 함축할수 있는 합리적인 
방안으로 된다. 

Intel 8086 은 등록기조직 에서 여 러 가지 방법을 리용하고 있다. 여 기서는 일부 등록기들 
이 일반목적에 리용되고 있다고 해도 모든 등록기들을 특별한 목적 즉 전용으로 리용한다. 
8086 은 lbyte 혹은 16 bit 단위로 주소를 지정할수 있는 4 개의 16 bit 자료등록기와 4 개의 
16 bit 지시 및 첨수등록기를 가지고 있다. 자료등록기들은 일부 명 령들에서 일반목적 에 리 
용된다. 기타 다른 등록기들은 암시적으로 리용된다. 실례로 곱하기명령은 늘 축적기를 리 
용한다. 4 개의 지시등록기들은 여러가지 연산에 암시적으로 리용되며 이 연산은 토막변위 
를 가진다. 8086 에는 4 개의 16 bit 토막등록기들이 있다. 4 개의 토막등록기들중 3 개는 전 
용으로 리 용되 며 암시 적 으로 현재 명 령 토막 ( 분기 명 령 에 효과적 이 다. ) ，자료토막，탄창토 
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막을 지시하는데 리용된다. 전용 및 암시적 인 코드의 리용은 유연성을 줄이지만 코드를 압축 
할수 있게 한다. 8086 은 또한 명 령지시기，한비트상태 및 조종기 발들의 묶음을 가지고 있다. 

이상에서 본 두 처 리 장치에서의 등록기 조직 에 대 한 고찰은 CPU 등록기 들을 구성하 
는 가장 좋은 방법으로 되는 기본원리가 세계적으로 아직 없다는것을 보여 주고 있다 
[ TOON 81]. 전체 명 령 모임설계 와 많은 다른 CPU 설계 론쟁점 들에서 본바와 같이 이 것들 
은 어 디까지 나 판단과 맛을 본데 지 나지 않는다. 

등록기조직설계와 관련한 두번째 교훈적인 점은 그림 11-3 도에서 설명하고 있다. 이 
그림 은 사용자가 볼수 있 는 등록기 조직 을 Intel 80386 에 대 하여 보여 주고 있 다 
[ ELAY 85]. 80386 은 8086 을 확장하여 설계 한 32 bit 극소형 처 리 장치 이 다. 따라서 80386 은 
32 bit 등록기들을 가지 고 있다. 1 80386에서는 그 이전의 콤퓨터들에서 작성된 프로그람들 
과의 호환성 을 보장하기 위하여 새 로운 구성 을 보충하는것 과 함께 종래 의 등록기 조직 을 
유지하고 있다. 결국 이러한 설계원리에 기초하고 있으므로 32 bit 처리장치기본방식 역시 
등록기 조직 을 설 계하는데 서 유연성 이 제 한되 고 있 다. 


제 3 절. 명령주기 


꺼내기주기 _ 실행주기 새치기주기 





그림 11-4. 새치기를 가전 명령주기 


이 미 제 3 장 제 2 절에서 명 령주기 를 고찰하였 다. 그림 11-4 는 제 3 장 제 2 절에서 명 
령 주기 를 설 명하는 그림 들중의 하나( 그림 3-9) 를 되 풀이한것 이 다. 앞에 서 고찰한것 을 상 
기해 보면 명 령주기는 다음과 같은 부분주기로 이루어 진다. 

• 꺼 내 기 : 기 억 기 에 서 CPU 로 다음명 령 을 읽 는다. 

• 실행 : 조작코드를 해석 하여 지정된 연산을 수행 한다. 

• 새 치 기 : 새 치 기 가 가능하여 새 치 기 가 일 어 나면 현재 처 리 상태 를 대 피 시 키 고 새 치 기 
처리를 한다. 

여 기서는 명 령 주기 에 대 한 보다 상세한 고찰을 진행한다. 이 를 위하여 먼저 간접 주 
기 라고 하는 한가지 보충적 인 부분주기를 고찰한다. 


1 MC68000 이 이미 32bit 등록기를 리용하고 있으므로 이것의 완전한 확장인 MC 期 020[MACG84] 普 邊■空: 등록기조직 
을 리 용한다. 
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1. 간접주기 

이 미 제 10 장에서 명 령 실행 은 기 억기호출을 요구하는 하나이상의 연산수를 동반한다 
는것 을 보았다. 더 우기 간접 주소지 정 방식 이 리 용되 면 추가적 인 기 억 기 호출이 요구된 다. 

간접주소의 꺼내기는 하나이상의 명령부분주기에서 일어 난다고 볼수 있다. 이 결과 
를 보여 준것이 그림 11-5 이다. 이 그림에서 기본은 명령꺼내기와 명령실행의 호상교차 


부분이다. 명령이 CPU 로 들어 오면 임의의 



그림 11-5. 명령주기 


간접 주소지 정 방식 이 동반되 는가를 검 사한다. 
동반된 다면 필 요한 연산수를 간접주소지정 
방식 을 리용하여 불러 들인 다. 그다음 실 행 
이 뒤따르며 다음명령을 꺼내기전에 새치기 
가 있으면 그 처리를 한다. 

이 처리에 대한 다른 한가지 고찰방법을 
그림 11-6 에 보여 주었다. 이 그림은 그림 
3-12 를 수정한것 이 다. 그림 은 명 령주기 의 
본질을 보다 더 정확히 설명하고 있다. 명 
령을 불러 들이면 곧 그의 연산수가 식별된 
다. 그다음 기억기에서 매 입구연산수를 불 
러 내 며 이 처 리는 간접주소지정 방식 을 요 
구할수 있 다. 등록기연산수들은 불러 들일 
필요가 없다. 조작코드가 실행되면 곧 주기 
억기에 결과를 기억하는 처리가 진행된다. 


간접 간접 



2. 자료흐_ 

한 명령주기동안에 실행되는 사건들의 정확한 순서는 CPU 설계에 관계된다. 그러나 
무엇 이 일어 나야 한다는것 을 일 반적 인 용어 로 지적할수는 있다. 이제 CPU 가 기 억기주 
소등록기 ( MAR ) ，기 억 기 완충등록기 ( MBR ) ，프로그람계 수기 ( PC ) ，명 령 등록기 ( IR ) 를 가지 
고 있다고 하자. 
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예 약된 전용기억기위치 주소는 조종장치 로부터 MAR 에 넣 어 진다. 이 를 위하여 탄창지시 
기 를 리용할수 있 다. PC 에 는 그다음 새 치 기 루린의 주소가 넣 어 진다. 결과 적 당한 명 령 
을 불러 들여 다음명 령주기 를 시 작한다. 


제 4절. 명령관흐■처리 

콤퓨터체계가 발전하면서 보다 고속인 회로를 비롯한 선진기술의 우점들을 받아 들 
여 그의 성능은 크게 개선되 였 다. 콤퓨터의 성능개선에는 CPU 구성의 강화도 큰 영 향을 
미친다. 앞에서 이미 이와 관련한 실례들 즉 단일축적기보다 여러개의 등록기나 캐쉬의 
리용이 더 우월하다는것을 고찰하였다. 성능개선을 위한 공통적 이며 일반적인 다른 한가 
지 구성방법은 명령의 관흐름처 리 이 다. 

1. 관흐름처리의 전략 

명령의 관흐름처리는 제조업분야에서 조립선의 리용과 류사한 개념이다. 조립선은 
하나의 생산물이 여러 단계를 거처 나온다는 사실을 리용하고 있다. 조립선의 여기저기 
에서 생산처리를 하게 하면 각이 한 단계에서 생산물이 동시에 나올수 있 다. 이 처리를 
관흐름처리라고 말할수 있는데 그것은 관흐름에서와 같이 이미 접수된 입구들이 다른 끝 
에서 출구에 나타나기도전에 새로운 입구들이 접수되기때문이다. 

명령실행에 이 개념을 적용하자면 먼저 명령이 여러 단계를 가진다는것을 리해해야 
한다. 실례로 그림 11-6 에서 명령주기는 차례로 일어 나는 10개의 과제로까지 될수 있다. 
이 로부터 관흐름처 리 를 위한 일부 좋은 기회 가 있다는것을 알수 있다. 

이제 단순한 방법 으로서 명 령 처 리를 두 단계 즉 명 령꺼 내기단계와 명 령실행 단계로 
나누어 고찰해 보자. 주기억 기를 호출하지 않는 명 령 실행동안에 는 시 간이 있게 된다. 이 
시간을 현재명령의 실행과 병렬로 다음명령을 불러 내는데 리용할수 있다. 이 관흐름은 
두개의 독립적인 단계를 가진다. 즉 첫 단계에서는 명령을 불러 내여 그것을 완충(림시 
기억)한다. 두번째 단계가 놀고 있다면 첫 단계는 완충된 명령을 통과시킨다. 두번째 단 

계에 들어 가서 명령이 실행되는 
동안 첫 단계 는 임의의 리용되 지 
않고 있는 기억기주기를 리용하여 
다음명 령을 불러 내여 완충한다. 
이 것 을 명 령 미 러 꺼 내 기 (instruction 
prefetch ) 혹은 꺼 내 기 중첩 이 라고 
한다. 

이렇게 하면 명령실행의 속도 
를 높일수 있다. 만일 꺼 내기단계 
와 실행 단계가 갈은 시간에 있다 
면 명 령주기 시 간은 절 반으로 줄어 
들것 이 다. 그러나 구체적으로 관 
흐름을 고찰해 보면(그림 11-10 
i _) 실 행 속도가 두가지 리유로 2 
배로까지는 빨라 지지 않는다는것 
을 알수 있다. 


명령 

꺼내기 

명령 1 

실 행 

결과 

1 

— 1 


대기 

o . 

T ) 

새 주소 

f ' 一— 【나 

ᄂ TT 

명령 

꺼내기 

명령 

실 행 

결과 






편위 

니 

그림 11-10. 2 단계 명 령 흐름선 

ᄀ-단순고찰, l - 확장고찰 
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1 . 실행시간은 일반적으로 꺼내기시간보다 더 길다. 명령은 연산수의 읽기와 기억 그 
리고 일부 성능이 다른 연산을 동반한다. 따라서 꺼내기단계는 그의 완충기가 빌 
때까지 얼마간 기 다려 야 한다. 

2. 조건분기명령은 불러 들여야 할 다음명령의 주소를 알수 없게 한다. 따라서 꺼내 
기 단계는 실행단계 로부터 다음명 령의 주소를 받을 때까지 기다려야 한다. 실행단 
계 는 다음명 령 을 불러 내 는 동안 기다려야 한다. 

두번째 리유로부터 시간손실을 추측대로 감소시 킬수 있다. 단순한 규칙은 다음과 같다. 
조건분기 명 령 이 꺼 내 기 단계 로부터 실 행 단계 로 넘 어 가면 꺼 내 기 단계 는 분기 명 령 후에 기 
억기에서 다음명령을 불러 낸다. 다음명령이 분기명령이 아니면 시간손실은 없게 된다. 
분기명령인 경우는 불러 낸 명령이 포기되며 다음명령을 불러 들인다. 

이상에서 본 인자들이 2 단계 관흐름의 잠재적인 효과성은 감소시키지만 일부 속도 
상승도 가져 온다. 보다 더 높은 속도상승을 얻자면 관흐름이 보다 많은 단계를 가져야 
한다. 이제 명령처리과정을 다음과 같이 분할해 보자. 

• 명령꺼내기 ( FI ) : 다음에 실행해야 할 명령을 완충기에 넣기 

• 명령해신 ( DI ) : 조작코드와 연산수지정자를 해신 

• 연산수계산 ( CO ) : 매 원천연산수의 유효주소계산. 여기에는 변위,등록기간접, 간 
접 기타 다른 양식의 주소계산이 동반된다. 

시간 


명령 1 
명령 2 
명령 3 
명령 4 
명령 5 
명령 6 
명령 7 
명령 8 
명령 9 


I 2 M 4 h 


| 7 | 8 | 9 110 | 11 | 12 | 13 114 | 


CO ( FO,EI ,WO, , , , , 

I I I I I I I I 

DI I CO ■ FO ■ El ■ WO I I I I 

1+ ♦■세 ■ II t It I | I 

■ DI 'CO 1 FO’EI 'WO 1 1 1 

j i 1 1 i I I 

I I I I I I I I 

1 IDI ICO | FO I El |WO| I 
■—i 
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I 命 
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I ■ ■••■++WWW，， 1 



그림 11-11. 명령흐름선동작의 시간선兵 
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• 연산수꺼내기 ( FO ) : 기억기로부터 매 연산수를 꺼내기 . 등록기로 연산수를 불러 
들일 필요는 없다. 

• 명 령 실 행 ( EI ) : 지 정 된 연산을 수행 하고 결 과를 지 정 된 목적 연산수위 치 에 기 억 

• 연산수쓰기 ( WO ) : 기 억기 에 결과를 기 억 

이와 같이 세분화하여 분할하면 여러개의 단계들이 보다 가깝게 같은 존속시간에 있 
게 된다. 설명 을 위하여 이 단계들이 같은 시 간에 있다고 가정한다. 그림 11-11 은 6개의 
단계를 가진 관흐름이 9개의 명령에 해당한 실행시간을 54시간단위로부터 14시간단위로 
줄일수 있다는것을 보여 주고 있다. 

여 러개의 설명문들이 차례로 있다. 그림에서 선도는 매 명령 이 관흐름의 모든 6개의 
단계들을 통과한다고 가정하고 그린것이다. 그러나 늘 이와 같이 되지는 않는다. 실례로 
넣기명령은 W 0 단계가 필요 없다. 그러나 관흐름하드웨어를 간단히 하기 위하여 매 명령 
이 6 개의 모든 단계를 요구한다고 가정하고 시간선도를 그렀다. 또한 선도는 모든 단계 
들이 병 렬로 수행된다고 가정 하고 그렸다. 그리 고 특별히 기 억기충돌은 없다고 가정한다. 
실례로 FI , FO 와 W 단계들은 기억기호출을 동반하는데 시간선도는 이 호출들이 동시에 
일어 날수 있다는것을 암시하고 있다. 그러나 대다수 기억기체계에서는 이것이 허용되지 
않는다. 그렇 지 만 필 요한 값이 캐 쉬내 에 있을수도 있 고 FO 혹은 W 0 단계 가 없을수도 있 
다. 따라서 기 억기충돌은 많은 시 간동안 관흐름을 지체시키지는 않는다 


시간 분기의 성능악화 
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그림 11-12. 명 령흐름선동작에 미치는 조건분기의 영 향 















관흐름단계에서 동， 
의 인자는 조건분기 
측불가능한 사건으로 
분기의 영향을 보여 
■고 있다. 명령이 실장 
서 관흐름은 단순히 
가 없으며 완전히 성 
•단위 7 이 끝날 때 까; 
다. 시간단위 8기간 
단위12사이에 완전경 
는 성 능악화이다. 그 
흐름을 보여 주었다. 
여기에서는 앞에서 
구성에서는 나타나 
생 한다. CO 단계 는 o 
는 앞선 명령에 의 
•록기 내용에 관계 된 ^ 

• 기억기와의 충돌이 
•서 체계는 이와 같나 
에 따라 동작해 야 힌 
앞에서 이미 고찰한 

더 많은 단계들이 
속도가 더 빨라 진 r 
부 IBM S /360 의 설 
서 이 러한 매우 단 
는 다음과 갈은 두고 
다 [ANDE 67]. 

• 관흐름의 매 단계 
충기로 자료를 o 
준비 및 전달기능 
는 간접소비시간 
단일명령의 총체경 
간 길게 할수 있>： 
명령들이 빈번한 
억기호출의 의존사 
로 종속되는 경우， 

• 기억기 및 등록기 
며 관흐름리용을 



명령관흐름처리는 성능을 제고하기 위한 위력한 기술이지만 복잡성을 합리적으로 
구성하여 최적인 결과를 얻자면 설계를 주의하여야 한다. 

2. 관흐름의 성능 

여기서는 관흐름의 성능과 상대적인 속도상승에 대한 정량적인 고찰을 간단히 한다 
([ HWAN 93] 에서의 론의 에 기초하고 있다.). 명 령관흐름의 주기 시 간 r 는 관흐름을 통하 
여 명령 한 단계의 모임을 만드는데 필요한 시간이다. 그림 11-11 과 11-12 에서 매렬은 
한주기 시 간을 표시한다. 이 주기 시 간은 다음과 같이 결정 된다. 

v = max [ r 교 ■ 선 = r m +d i , 1 ^ f S k 

여기서 

청성—최 대단계 지 연 (가장 큰 지 연을 주는 단계 의 지 연)， 
k -명령관흐름에서 단계들의 수， 

d -한 단계에서 다른 단계로 신호나 자료를 전파시키는데 요구되는 빗장의 시간지연 
일 반적 으로 시 간지연 d 는 박자임 풀스와 갈으며 r tt 》d 의 관계 를 가진다. 이 제 n 개 
의 명령이 분기가 없이 처리된다고 하자. n 개의 모든 명령을 실행하는데 요구되는 총 시 
간 T k 는 다음과 같다. 


T k =[k + ( n - 1)] r (11-1) 

총 소 개의 주기는 첫번째 명 령의 실행을 완성하는데 걸리는 시 간이며 나머지 n -1 개 
의 명령들은 «_1 개의 주기를 요구한다. 2 이 식은 그림 11-11 로부터 쉽게 확증된다. 아 
홉번째 명 령은 시간주기 14 에서 완성된다. 

14 = [6 + (9 - 1)] 

명령관흐름에서 속도상승인자는 관흐름이 없는 실행과 비교한 경우 다음과 같다. 

_ T \ _ nkz _ nk 

노 T k [k + ( n - l)Jz k + ( n - l ) 一 

그림 11-14 n 는 분기가 없이 실행되는 명령개수의 함수로서 속도 상승인자를 보여 
준다. 기대했던대로 극한 ( n — oo ) 에서 소배의 속도 상승이 일어 난다. 그림 11-14 i _ 는 명 
령관흐름에서 단계수의 함수인 속도 상승인자를 보여 준다. 3 이 경우에 속도 상승인자는 
분기가 없이 관흐름에 공급될수 있는 명령의 개수로 다가간다. 따라서 관흐름단계를 많 
이 할수록 속도 상승가능성 이 더 커진다는것을 알수 있다. 그러나 실천적 인 문제로서 추 
가적 인 관흐름단계들의 도입은 비용증가，단들사이 지연，관흐름의 범람이 분기들에 의해 
서 초래될것 이 라는 사실 등을 낳는다. 결국 임의의 관흐름에서 그 단계의 수가 6〜9 단계 
를 넘 어 서도록 추가적으로 단계를 늘이면 비생산적 이 라는것을 알수 있다. 


주기시간은 모든 단계가 다 있는 경우에만 r 의 최대값과 같아 진다.첫 하나 혹은 몇주기동안에는 r 의 최대값보 
다 작게 된다. 

x 축은 그림 11-14 에서는 로그척도，그림 11-14 l 에서는 선형척도이 다. 
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3. 분기처리 


속도상승인자 


명령관흐름을 설계하는메서 중 
요한 문제의 하나는 관흐름의 초기 
단계들에서 명령들의 련속흐름을 보 
장하는것이다. 이 문제에서 기본장애 
로 되는것은 이미 보았지만 조건분 
기명령이다. 조건분기명령인 경우 명 
령이 실지로 실행될 때 까지 는 분기 
가 있는지 없는지 판정하기 힘들다. 

그리하여 조건분기처리를 위한 
다음과 같은 여러가지 방법들이 연 
구되였다. 

• 다중흐름 

• 분기목표미러꺼내기 

• 고리완충기 

• 분기예측 

• 지연분기 


다중흐름 

단순한 관흐름은 다음에 불러 
내는 두개의 명령중 어느 하나를 선 
택해야 하며 또 선택을 잘못할수도 
있으므로 분기명령으로 인하여 성능 
이 악화된다. 이것을 해소하기 위한 강력한 방법으로서 관흐름의 초기부분을 사본화해 
놓고 두개의 흐름을 리용하도록 관흐름이 명령을 둘 다 불러 내게 하는것이다. 이 방법 
은 두가지 문제점을 낳는다. 

• 다중관흐름인 경우는 등록기 및 기억기에 대한 호출에서 경쟁으로 인한 지연이 
생긴 다. 

• 추가적인 분기명령이 초기분기판정 이 이루어 지기도전에 관흐름(다른 흐름)에 들 
어 올수 있다. 이때 매 명령은 추가적인 흐름을 요구한다. 

이와 같은 결함이 있음에도 불구하고 이 전략은 성능을 개선할수 있다. IBM 370/168 과 
IBM 3033 은 2개 혹은 그이 상의 관흐름을 가진 대 표적 인 콤퓨터 들이다. 

분기목표의 미리꺼내기 

조건분기로 판정되면 분기에 뒤따르는 명령외에 분기목표를 미리 불러 낸다. 이 목 
표는 분기명령이 실행되는 기간 대피된다. 분기가 일어 났다면 목표는 이미 미리 불러 
들인것으로 된다. 

IBM 360/91 은 이 방법을 러용하였다. 

고리완충기 

고리 완충기 는 관흐름의 명 령 꺼 내 기 단계 에 리 용되 는 작고 속도가 매 우 빠른 기 억 기 로 
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서 련속적으로 불러 들인 N 개의 명 령들을 기 억한다. 분기가 일어 나면 하드웨 어는 우선 
분기 목표가 이 완충기내 에 있는가를 검 사한다. 고리 완충기내 에 있 다면 그 완충기 로부터 
불러 낸 다. 고리완충기 는 다음과 갈은 세 가지 우점 을 가진 다. 

• 미 리꺼 내기를 진행하면 고리완충기는 현재명 령의 꺼 내기주소보다 앞에 있는 련속 
적인 일부 명령들을 가질수 있다. 련속적으로 불러 낸 명령들은 보통의 기억기호 
출시간을 들이 지 않고도 리 용할수 있 다. 

• 분기가 분기명령의 주소에서 얼마간 앞위치에서 일어 난다면 분기목표는 이미 완 
충기 내 에 있게 된 다. 이 것 은 IF-THEN 과 IF-THEN-ELSE 명 령 렬 의 공동발생 에 쓸 
모가 있다. 

• 이 방법 은 고리 혹은 반복처 리 에 특별 히 잘 맞는다. 따라서 이 름도 고러완충기 라 
고 부론다. 고리완충기가 고리내의 모든 명령을 가질수 있도록 충분히 크게 되면 
이 명 령 들은 첫 반복순환을 위하여 기 억 기 로부터 한번만 불러 내 면 된다. 

련속반복순환인 경 우는 필 요한 모든 명 령 들이 이 미 완충기내 에 있게 된다. 고러 
완충기 는 원리 적 으로는 명 령 들에 전용으로 리용되 는 캐 쉬 와 류사하다. 차이 점 은 고리 

완충기가 오직 련속명령들만을 가지며 
크기가 훨씬 더 작고 따라서 비용이 
눅다는것 이 다. 

그림 11-15 는 고러완충기 의 한가지 
실례를 보여 주고 있 다. 완충기가 
256 byte 를 가지고 바이트주소지 정을 리 
용한다면 맨 아래자리 8 개의 비트들이 
완충기 를 지 정하는데 리 용된 다. 나머 지 
대다수 비트들은 분기목표가 완충기라는 
포위 된 환경내 에 있 는가를 판정하도록 
검사된 다. 

고리완충기 를 리용하는 콤퓨터 들중 
에 는 일 부 CDC 를 퓨 터 들 ( Star -100, 
6600, 7600) 과 CRAY -1 이 있다. Motorola 
68010 에서는 전문화된 형식의 고리완충기를 리용하고 있는데 이 고리완충기는 DBcc (조 
건에 대한 감소 및 분기)명령 (이 장의 련습문제 6 참고)을 포함하는 3 개의 명령으로 된 
고리를 가질수 있다. 3 개의 단어완충기는 명령들을 보유하여 고리조건이 만족되는 기간 
은 처 리 장치 가 이 명 령 들을 반복하여 실 행할수 있게 한다. 

범 I 예_ 

분기가 일어 나겠는가를 예측하는데는 여러가지 방법들이 있다. 그중에서 일반적인 
것들은 다음과 갈다. 

• 절대로 일어 날수 없다고 예측 

• 늘 일어 난다고 예측 

• 조작코드에 의한 예측 

• 일어 남/일어 나지 않음스위치 

• 분기경력표 

우의 다섯가지 방법들가운데서 첫 세개의 방법들은 정적방법들이다. 즉 이 방법들은 


분기 주소 

8 고리완충기 만는 경 우 

(256byte) sfl 신되 는 명 령 


예측이 맞았는가를 결정하기 위하여 
一-비교된 맨 웃자리주소비트들 

그림 11-15. 고리완충기 
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조건분기명 령시 간까지의 실행경력 에 의존하지 않는다. 마지막 두 방법은 동적 방법 으로서 
실행경력에 의존한다. 

다섯가지 방법들가운데서 첫 두 방법 이 가장 단순하다. 이 방법들은 늘 분기 가 일어 
나지 않으므로 련속적으로 명령을 불러 내는것을 계속하거나 늘 분기가 일어 나므로 분 
기목표로부터 불러 낸다고 가정한다. 68020과 VAX 11/780은 이 외 에도 잘못된 판정의 영 
향을 최소로 하기 위한 특징도 포함하고 있다. 만일 분기후의 명 령꺼내기가 폐지결함 혹 
은 보호위반을 일으킨다면 처리장치는 명령을 불러 내야 한다는것이 명백해 질 때까지 
그의 미 리꺼 내기동작을 중단한다. 

프로그람동작에 대한 분석결과는 조건분기가 그 시간의 50 %보다는 더 자주 일어 
난다는것을 보여 주고 있다 [ LILJ 88]. 그리 고 두 경 로로부터의 꺼 내기비 용이 같은 경우에 
는 늘 분기목표주소로부터의 미리꺼내기가 뒤따르는 경로로부터의 미리꺼내기보다는 더 
성 능이 좋다는것 을 보여 주고 있 다. 그러 나 페 지화된 콤퓨터 들에 서 는 분기목표를 미 리 
불러 내는것이 다음명령을 련속적으로 미리 불러 내는것보다 폐지결함을 더 쉽게 가져 
오므로 이 성 능약화를 고려해 야 한다. 성 능회 복기 구는 이 악화를 감소시 킬수 있도록 적 
용되여 야 한다. 

정적방법들가운데서 제일 마지막방법은 분기명령의 조작코드에 기초하여 판정을 진 
행한다. 처 리 장치는 분기 가 일정한 조작코드에 대 하여서 만 일 어 나며 기 타는 일 어 나지 
않는다고 본다. 문헌 [ LIU 88] 은 이 전략을 리용하여 75 %이상의 성공률을 엄을수 있다 
는것을 보여 주고 있다. 

동적 인 분기전략은 프로그람내 에서 조건분기명 령의 경 력을 기록하는것 으로서 예 측정 
확도를 높이고 있다. 실례로 하나이상의 비트들은 명령의 최신경력을 되돌리는 매 조건 
분기명령과 련관시킬수 있다. 이 비트들을 일어 남/일어 나지 않음스위치라고 한다. 이 
스위치는 명령을 만나는 다음시간에 알맞는 판정을 진행하도록 처리장치에 지시하는 역 
할을 한다. 이 경력비트들은 주기억기 내의 명 령과는 련관이 없다. 오히 려 이 비트들은 림 
시고속기억기내 에 보존된다. 이 비트들을 캐쉬내에 있는 임의의 조건분기명 령과 련관시 
킬수 있는 가능성이 있다. 명령이 캐쉬내에 재배치될 때 그의 경력은 없어 진다. 다른 또 
한가지 가능성은 캐쉬에로의 기입시에 하나 혹은 그이상의 비트들에 최근에 실행된 분기 
명 령을 위한 작은 표를 보존하는것 이 다. 처 리 장치는 캐쉬와 같이 련상적 으로 표를 호출 
하거 나 혹은 분기 명 령 주소의 낮은 자리비 트들을 리 용하여 호출할수 있 다. 

단일비트를 리용하는 경우 기록될수 있는것은 이 명령의 마지막실행이 분기로 끝나 
는가 아니 면 분기 로 끝나지 않는가 하는것 뿐이 다. 단일 비 트를 리용할 때 의 결 함은 고리 
명령과 같이 거의 늘 일어 날수 있는 조건분기명령인 경우에 나타난다. 한비트로 된 경 
력 을 리용하면 오유가 고리 를 리용할 때 마다 두번 발생한다. 즉 고리 에 들어 가면서 한 
번，고리 에 서 빠져 나오면서 한번 발생한다. 

두개의 비트를 쓰는 경우는 관련된 명령실행의 마지막 두 경우의 결과를 기록하거나 
일부 다른 형식에서의 상태를 기록하는데 리용할수 있다. 그림 11-16 은 이와 관련한 전 
형적 인 방법을 보여 주고 있다(다른 가능성을 위하여 이 장의 련습문제 5 참고). 판정처 
리는 4개의 상태를 가진 유한상태기계로 표시할수 있다. 주어 진 명 령의 마지막 두 분기 
가 같은 경로에서 일어 난다면 예측은 그 경로를 취하는것으로 된다. 그 예측이 맞지 않 
으면 명령과 만나는 다음시간에 여전히 같은 경로를 취한다. 예측이 또 맞지 않았다면 
다음예측은 반대경로를 선택한다. 결국 알고리듬은 두번의 예측이 련속적으로 틀릴수 있 
다는 전제 하에서 예 측판정 을 한다. 례 를 들어 분기 가 한 고리내 에서 한번만 비정상적 인 
방향으로 일어 나면 그때 예측은 단 한번 틀릴것 이 다. 
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일어 남/일어 나지 않음스위치 
방법을 러용하는 체계의 대표적인 
실례는 IBM 3090/400 이다. 

우에서 언급한바와 같이 경력 
비 트들의 리용은 한가지 결 함을 가 
지고 있다. 즉 판정결과가 분기가 
있는것으로 되면 조건분기명령에서 
연산수인 목표주소가 해신될 때까 
지 목표명령을 불러 낼수 없다. 분 
기판정이 진행되자 곧 명령꺼내기 
를 시작할수 있으면 보다 큰 효과 
성을 기대할수 있다. 이를 위해서는 
보다 많은 정 보를 분기목표완충기 
혹은 분기경 력표에 가지 고 있 어 야 
한다. 

분기경 력 표는 관흐름의 명 령 꺼 
내 기단계 와 련관되 는 작은 캐 쉬 이 
다. 표에로의 기입은 세가지 요소 
즉 분기명령의 주소, 그 명령의 리용상태를 기록하는 몇개의 경력비트들의 개수, 목표명 
령에 대한 정보로 이루어 진다. 대다수 제안들과 그 실현에서는 이 세번째 마당이 목표 
명령의 주소로 된다. 세번째 마당에는 목표명령도 포함시킬수 있다. 세번째 마당에 목표 
주소를 넣겠는가, 목표명령을 넣겠는가 하는것은 잘 생각하여 합리적인 방안을 찾아야 
한다. 목표주소를 기 억하는것은 표의 크기를 작게 하지만 목표명 령을 넣는 방식 에 비해 
더 큰 명령꺼내기시간을 요구한다 [ RECH 98]. 

그림 11-17 은 이 현상을 절대로 일어 나지 않는다고 예측하는 방법인 경우에 대하 
여 보여 주고 있다. 목표주소를 넣는 방식 에서는 명 령꺼 내기단계 가 늘 다음의 련속되는 
주소를 불러 낸다. 분기가 있으면 처리장치에서 일부 론리요소가 이것을 검출하여 다음 
명 령을 목표주소로부터 불러 들일것을 지시한다. 분기경력표는 캐쉬로서 취급된다. 모든 
미 리꺼 내 기는 분기경 력표에서 검사를 시 작한다. 일 치하는것 이 발견되지 않으면 다음순서 
의 주소를 불러 들인다. 이 주소에 대한 일치가 있으면 예측은 명령의 상태에 기초하여 
이루어 진다. 즉 다음에 련속되는 주소 혹은 분기목표주소가 선택론리요소에 공급된다. 

분기명령이 실행되면 실행단계는 그 결과와 함께 분기경력표를 론리요소에 신호한다. 
명 령의 상태 는 정 확한 혹은 비 정 확한 예 측을 되돌러 도록 갱 신된다. 예 측이 비정확한 경 
우는 선택론리 가 다음꺼 내 기를 위한 정 확한 주소를 다시 가러켜 준다. 조건분기명 령 이 
이 표내에 없다는것 이 확인되면 그것이 표에 추가되며 출구기입들중의 하나를 제 4 장에 
서 고찰한 캐 쉬 재 배 치알고리 듬들중의 어 느 하나를 리 용하여 버린 다. 

고급한 마이 크로장치 인 AMD 29000 극소형 처 리 장치 에서 는 분기 경 력 표를 리 용하고 있다. 

지연분기 

프로그람내 에 서 명 령 들을 자동적 으로 재 배렬 하면 관흐름의 성 능을 개 선 할수 있다. 
이렇게 되면 분기명령들이 실제적으로 자기 시간보다 후에 지연되여 일어 날수 있다. 이 
와 같은 지 연된 분기 를 꾸미 는 방법 은 제 12 장에 서 구체 적 으로 고찰한다. 


일어 남 



그림 11-16. 분기예측상태도 
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INTEL 80486 의 관흐름처리 


186은 5 단계 로 된 관흐름을 가지 고 있 다. 

커내기: 이 단계에서는 명령들을 캐쉬 혹은 외부기억기에서 불러 내여 두개의 
L 6 byte 미 리 꺼 내 기 완충기 중 어 느 하나에 넣 는다. 이 단계 의 목적 은 낡은 자료가 명 
령 해 신기 에 의 해 소비 되 자마자 새 자료를 미 리꺼 내 기 완충기 에 넣 는것 이 다. 명 령 들 
이 앞붙이를 계산하지 않고도 1 부터 llbyte 까지의 범위내 에서 그 길이 가 변하므 
로 다른 관흐름단계와 관련되는 미리꺼내기상태는 명령에 따라 변한다. 평균적으 
로 대략 5 개의 명령들을 16 byte 씩 넣으면서 불러 낸다. 꺼내기단계는 미리꺼내기 
완충기를 꽉 채우도록 다른 단계와는 독립적 으로 동작한다. 

태신단계 1: 이 단계에서는 모든 조작코드와 주소지정방식정보를 해신한다. 이 단 
계를 간단히 D 1 단계라고도 한다. 명령길이정보와 같은 정보는 많아서 명령의 첫 
3 byte 에 포함된다. 따라서 이 3 byte 를 미 리꺼 내기 완충기 에서 꺼 내여 해 신한다. D 1 
태신기 는 그다음 D 1 해 신에 참가하지 않은 명 령의 나머지 부분(변위 와 직 접값자료) 









• 해신단계 2: 이 단계에서는 매 조작 코드를 ALU 에 필요한 조종신호로 확장한다. 
또한 복잡한 주소지정 방식들의 계산을 조종한다. 

• 실행 : 이 단계 는 ALU 연산，캐쉬호출，등록기갱 신 등의 동작을 수행한다. 

• 뒤로쓰기: 이 단계는 필요한 경우 앞의 실행단계에서 변경된 등록기 및 상태기발 
을 갱신한다. 현 명령이 기억기를 갱신한다면 계산된 값을 캐쉬와 모선대면부쓰 
기완충기 에 동시 에 보낸 다. 

두 해신단계를 리용하면 관흐름이 박자주기당 하나의 명령에 가까운 처리능력을 유 
지할수 있 다. 복잡한 명 령 들이나 조건분기명 령 들은 이 속도를 보장할수 없 다. 

그림 11-18 은 관흐름의 동작실 례 를 보여 주고 있 다. 이 그림 에 서 자 는 기 억 기호출을 
요구 할 때 관흐름에서 생기는 지연이 없다는것을 보여 주고 있다. 그러나 이 그림의 l 
에서 보는바와 같이 기억기주소를 계산하는데 리용된 값인 경우에는 지연이 있을수 있다. 
즉 값을 기 억기 로부터 등록기로 넣 고 그다음 그 등록기를 다음명 령의 기준등록기 로 리용 
하는 경우에는 처 리 장치 가 한주기동안 정지한다. 이 실례 에서 처 리 장치는 첫번째 명 령의 
실행 단계 에서 캐쉬를 호출하고 뒤 로쓰기단계 기 간에 등록기 에 씌 여 진 값을 기 억 한다. 그 
런데 다음명 령 이 해신단계 2에서 이 등록기를 요구 한다. 해 신단계 2가 앞선 명 령의 뒤로 
쓰기단계 와 나란히 서 게 되 면 우회신호경 로는 해 신단계 2 가 뒤 로쓰기단계 에 서 리 용하고 
있는 갈은 자료에 대 한 호출을 진행하도록 하여 관흐름의 한 단계 를 절 약한다. 


1 꺼내기 

D 1 

D 2 

EX 

WB 

MOV Regl, Meml 


꺼내기 

D 1 

D 2 

EX 

WB 

MOV Mem2, Regl 



꺼내기 

D 1 

D 2 

EX 

WB | 


1 꺼내기 

D 1 

D 2 

EX | 

WB 



꺼내기 

D 1 


D 2 

EX | 


MOV Regl，Meml 
MOVRegl, (Reg2) 


| 꺼내기 

D 1 

D 2 

EX 

WB 



꺼내기 

D 1 

D 2 

EX 






꺼내기 

D 1 | D 2 | EX | 


CMP Regl, Imm 
Jcc Target 
Target 


n) 


그림 11-18. 80486 명 령 흐름선실례 

*1 •••흐름선에서 자료넣기지연이 없다， L - 지시기넣기지연， C - 분기명령동기 

그림 11-18 n 는 분기 가 있 다고 가정 한 경 우 분기 명 령 의 시 간일 치 (동기 화) 를 보여 주 
고 있다. 비교명 령은 뒤로쓰기단계 에서 조건코드를 갱 신하여 뛰여넘기명 령의 실행 단계에 
서 우회경로가 이 조작코드를 리용할수 있도록 한다. 이와 병행하여 처리장치는 뛰여넘 
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기명 령의 실행 단계기 간 뛰 여 넘기목표에서 추상적 인 꺼 내기 주기를 실행 한다. 처 리 장치 가 
거짓분기조건을 판정하면 이 미리꺼내기는 취소되고 다음에 련속되는 명령의 실행을 계 
속한다(이미 불러 내여 해신하였다.). 

제 5 절. Pentium 처리장치 

Pentium II 처리장치조직과 관련한 개괄은 이미 그림 4-23 을 통하여 보았다. 이 절에 
서는 일부 보다 상세 한 점들을 고찰한다. 

1. 등록기의 조직 

등록기 조직은 다음과 갈은 형의 등록기들을 가지고 있다 (표 11-1). 

• 일반형 : 8 개의 32 bit 일반등록기들이다(그림 11-3 n 참고). 등록기들은 모든 형 
의 Pentium II 명 령들에 리 용할수 있다. 또한 주소계 산을 위 한 연산수를 가질수 있 
다. 이외에 일부 등록기들을 특별한 목적에 전용으로 쓸수 있다. 실례로 문자렬명 
령은 명령에서 이 등록기들을 명시적으로 참조하지 않고도 연산수로서 리용할수 
있는 ECX , ESI , EDI 등록기 들의 내 용을 리용한다. 결국 여 러개의 명 령들을 보다 
함축하여 프로그람을 작성할수 있 다. 

• 토막: 6개의 16 bit 토막등록기 들은 토막선택기 들을 가지 는데 이 토막선택기 들은 제 
7 장에서 고찰한바와 같이 토막표들에서 첨수를 가리킨다. 코드토막 ( CS ) 등록기는 
실행되고 있는 명령을 가지는 토막을 참조한다. 탄창토막 ( SS ) 등록기는 사용자가 
볼수 있는 탄창을 가지는 토막을 참조한다. 나머지토막등록기들 ( DS , ES , FS , GS ) 
은 사용자가 한번에 4개 까지의 개 별적 인 자료토막들을 참조할수 있게 하는데 쓴다. 

• 기발: EFLAGS 등록기는 조건코드와 여러가지 방식비트들을 가진다. 

• 명령지시기 : 현재명령의 주소를 가진다. 


표 11-1. Pentium II 처리장치의 등록기들 기옹근수단위 


형 

수 

길이 ( 비트 ) 

목적 

일반 

8 

32 

일반사용자등록기 

토막 

6 

16 

토막선택기를 가전다 

기발 

1 

32 

상래 및 조종비트 

명령지시기 

1 

32 

명령지시기 

L) 류점수단위 

형 

수 

길이 ( 비트 ) 

목적 

수값 

8 

80 

류점수를 가진다 

조종 

1 

16 

조종비트들 

상래 

1 

16 

상래 비트들 

꼬리표단어 

1 

16 

수값등록기의 내용 규정 

명령지시기 

1 

48 

례외에 의해 중단된 명령을 지적 

자료지 시 기 

1 

48 

례외에 의해 중단된 연산수를 지적 
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등록기조직에는 또한 특별히 류점수단위로 동작하는 등록기들도 있다. 

• 수값 : 매 등록기는 확장된 정확도를 가진 80 bit 의 류점수를 가진다. 여기 에는 밀 
어넣 기와 밀 어꺼 내기 와 같은 연산을 진행하며 탄창으로서의 기능을 수행 하는 8 개 
의 등록기들이 있다. 

• 조종 : 16 bit 의 조종등록기 는 반올림 조종의 형 들인 단정 확도，배 정 확도, 확장된 정 
확도를 가진 류점수단위의 연산을 조종하는 비트들과 여 러가지 례외조건들을 가 
능 혹은 불가능하게 하는 비트들을 가진다. 

• 상태 : 16 bit 의 상태 등록기는 탄창의 꼭대 기 에 있는 3 bit 의 지시기 를 포함하여 류 
점 수단위 의 현재 상태 를 반영 하는 비 트들을 가진 다. 3 bit 의 지 시 기 는 마지 막명 령 
의 결과를 보고하는 조작코드와 례외기발들을 가진다. 

• 꼬리표단어 : 이 16 bit 의 등록기는 모든 류점수값등록기 에 대 하여 두비트의 꼬리 
표를 가진다. 이 꼬리 표는 대 응하는 등록기 내 용의 속성 을 지 적 한다. 속성 에 는 4 가 
지 가능한 값들 즉 유효，령，특별 ( NaN , 무한대，비정 규화)，빔 이 있다. 이 꼬리 표 
들은 프로그람들이 등록기내 에서 실지자료의 복잡한 해 신을 수행 함이 없이 수값 
등록기의 내용을 검사할수 있게 한다. 실례로 전후관계에서 변화가 일어 나면 처 
리장치 는 빈 임의의 류점수등록기 를 보관할 필요가 없다. 

이상에서 고찰한 등록기들의 리용은 쉽게 리 해 가 된다. 이제 여 러개의 등록기 들을 
보다 상세 히 고찰해 보자. 

티 1 LAGS 등록기 

EFLAGS 등록기 (그림 11-19) 는 처 리 장치 의 조건을 가리 키 며 연산을 조종하도록 돕 
는다. 이 등록기 에는 표 9-8 에서 정의한 6개의 조건코드 즉 자리올림，기우성 , 보조자리 
올림，령，부호, 자리넘침조건코드들이 포함되여 있다. 이것은 옹근수연산결과에 대한 보 
고라고 볼수 있다. 이외에 조종비트들로서 다음과 갈은것들이 있다. 

• 내부새 치기기발 ( TF ): 설정되면 매 명 령의 실행후에 새 치기 가 발생한다. 오유수정 
에 리용한다. 

• 새 치 기가능기 발 ( IF ) : 설 정 되 면 처리 장치 는 외 부새치 기 를 접 수한다. 

• 방향기 발 ( DF ) : 문자렬처 리명 령 이 16 bit 의 반등록기 SI 와 Dl (16 bit 연산인 경우) 
혹은 32 bit 의 등록기 ESI 와 EDI (32 bit 연산인 경우) 를 증가 혹은 감소시키는가 
를 결 정한다. 

• I/O 특권기발 ( IOPL ): 설정되면 처리장치가 보호방식동작기간 I/O 장치에 대한 모 
든 호출에서 례외를 발생시키도록 한다. 

• 재개기발 ( RF ) : 프로그람작성자가 명령이 오유수정후에 또 다른 오유수정을 즉시 발 
생시킴이 없이 다시 시작될수 있도록 오유수정을 불가능으로 만든다. 

• 일치검사 ( AC ): 단어 혹은 배단어가 비단어 혹은 비배단어경계로 지정된 경우 설 
정된 다. 

• 식별기발 ( ID ): 이 비트가 설정되여 지워 지면 처리장치가 CPUID 명령을 지원하고 
있다는것을 가리킨다. CPUID 명 령은 회사，계 렬，모형 에 대 한 정보를 준다. 

이외에도 동작방식과 관련한 4 개의 비트들이 있다. 겹쌓인 과제 ( NT:Nested Task ) 기 
발은 현재 과제 가 보호방식동작으로 다른 과제내 에 있 다는것 을 지 시한다. 가상방식 
( VM：Virtual Mode ) 비 트는 프로그람작성 자가 가상 8086 방식 을 가능 혹은 불가능하게 한 
다. 가상 8086 방식 은 처 리 장치 가 8086 기 계 로 동작하겠는가를 결정 한다. 가상새 치 기 기 발 
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(VIF ) 과 가상새 치 기 미 정 (VIP ： Virtual Interupt Pending) 기 발은 다중과제 처 리 환경 에 서 리 용 
한다 . ᄂ 




ID - 식별기발 
VIP - 가상새 치 기 미 정 


NT - 겹 쌓임 과제 기발 SF - 부호기발 

IOPL - I/O 특권준위 ZF - 령 기 발 


VIF - 가상새 치 기 기 발 
AC - 일 치검사 
VM - 가상 8086 방식 
RF - 가정기 발 


OF - 자리넘 침 기 발 
DF - 방향기 발 
IF - 새치기가능기발 
TF - 추적 기 발 


AF- 보조자리올림기 발 
PF - 기 우성 기 발 
CF- 자리올림기 발 


그림 11-19. Pentium II EFLAGS 등록기 


조종등록기 

Pentium II 는 처 리 장치 동작의 각이 한 상황을 조종하는 4 개 의 32bit 조종등록기 (등록기 
CR1 은 리용되 지 않는다. )를 가지 고 있다(그림 11-20). CR0 등록기 는 체 계조종기발로서 
개별적인 과제의 실행을 위해서가 아니라 일반적으로 처리장치에 적용하는 방식을 조종 
하거 나 상태 를 지 적한다. 기 발들은 다음과 같다. 

• 보호가능 (PE) : 동작의 보호방식을 가능/불가능하게 한다. 

• 감시협동처 리장치 (MP:Monitor Coprocessor) : Pentium II 의 이전 계 렬의 를퓨터 
들로부터 프로그람을 집행하고 있을 때에만 유용하다. 산수연산협동처리장치의 존 
재와 관련된다. 

• 모방 (EM) : 처 리 장치 가 류점 수단위 를 가지 지 않을 때 설 정 되 며 류점 수명 령 을 실 
행 하려 는 시 도가 있 을 때 새 치 기 를 발생 한다. 

• 과제절환 (TS) : 처리장치가 과제를 절환하였다는것을 가리킨다. 

• 확장형 (ET) : Pentium II에서는 리용되지 않는다. Pentium II 이전 계렬의 기계들 
에서 수학협동처 리 장치명 령의 지 원을 가리키 는데 리 용된다. 

• 수값오유 (NE) : 외부모선들에서 류점수오유를 보고하는 표준기구를 가능하게 한 
다. 

• 쓰기 보호 (WP) : 이 비 트가 지 워 지 면 읽 을수만 있는 사용자준위 페 지 들을 체 계 관리 
자처리 에 의해 쓰기 가 가능하게 할수 있다. 이 성 질은 일부 조작체 계 들에서 처 리 
창조를 지원하는데 쓸모가 있다. 

• 일치마스크 (AM) : 일치검사를 가능/불가능하게 한다. 

• 쓰기불가능 (NW) : 자료캐쉬의 동작방식을 선택한다. 이 비트가 설정되면 자료캐 
쉬를 쓰기동작으로부터 금지시 킨다. 

• 캐쉬불가능 (CD) : 내부캐쉬채우기기구를 가능/불가능으로 한다. 

• 페지화 (PG) : 페지화를 가능/불가능으로 한다. 

페지 화가 가능하게 되면 CR2 와 CR3 등록기는 유효이다. CR 등록기는 페지 결함새 치 기 
가 발생 하기 전에 마지 막으로 호출한 폐지의 32bit 선형 주소를 가진다. CR3 의 맨 웃자리 비트 
로부터 20 개 의 비 트들은 페 지 등록부의 20 개 의 맨 웃자리비 트로 된 기 준주소를 보유한다. 
이 주소의 나머지부분은 0 으로 된다. CR3 의 두개의 비트는 외부캐쉬의 동작을 조종하는 
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단자들을 구동하는데 리 용된 다 . 페 지 준위의 캐 쉬 불가능 (PCD) 비 트는 외부캐 쉬 i 
불가능으로 만들며 폐지준위쓰기투과 (PWT) 비트는 외부캐쉬를 통하여 쓰기를 그 



SB5 圈 



PCE - 성 능계 수기 가능 
PGE- 페지전역가능 
MCE- 기계검사가능 
PAE - 물리주소확장 
PSE - 폐지크기확장 
DE - 오유수정확장 
TSD - 시 간표식 불가능 
PVI - 보호방식가상새치기 


VME - 가상 8086 방식 확장 
PCD - 폐 지 준위 캐 쉬 불가능 
PWT - 폐 지 준위 쓰기 투과 
PG -페 지화 
CD - 캐쉬불가능 
NW -쓰지 못함 
AM - 일치검사 


그림 11-20. Pentium II 조종등록기 


CR4 에는 다음과 같은 9개의 추가적 인 조종비트들이 있다. 

• 가상 8086 방식 확장 (VME) : 가상 8086 방식 에 서 가상새 치 기 기 발에 대 한 지 원 을 가 
능하게 한다. 

• 보호방식가상새 치기 (PVI) : 보호방식에서 가상새치기기 발에 대한 지원을 가능하게 한다. 

• 시 간표식 ( 압인 ) 불가능 (TSD) : 시 간표식 계 수기 로부터 의 읽 기 (RDTSC) 명 령 을 불가 
능하게 한다. 이 명령은 오유수정목적에 리용된다. 

• 오유수정확장 (DE) : I/O 중지점을 가능으로 한다. 이것은 처 리 장치 가 I/O 읽기와 
쓰기를 중단하도록 한다. 

• 페지크기확장 (PSE) : Pentium 에서 설정되면 4Mbyte 의 폐지， Pentium Pro 와 
Pentium II 에서 설정되면 2 Mbyte 의 페지 리 용을 가능하게 한다. 

• 물리주소확장 (PAE) : PSE 에 의해 조종되 는 특별한 새 로운 주소지정 방식 이 
Pentium Pro 와 Pentium II에 대하여 가능으로 되였을 때는 주소선 A35 로부터 
A32 까지 를 언제 나 가능으로 한다. 

• 기 계 검 사기 능 (MCE) : 기 계 검 사새 치 기 를 가능하게 한다. 이 새 치 기 는 자료기 우성 오 
유가 읽 기모선주기기 간에 일 어 나거 나 모선주기 가 성 공적 으로 완료되 지 않을 때 
일어 난다. 

• 페지전역가능 (PGE) : 총체적인 페지의 리용을 가능하게 한다. PGE=1 이고 과제절환 
이 수행되면 모든 TLB 기입은 표식이 붙은 전역을 제외하고 넘쳐 나게 된다. 
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• 성능계수기가능 ( PCE ): 임의의 특권준위 에서 성능계수기 읽기 ( RDPMC ) 명 령의 실행 
을 가능하게 한다. 두개의 성능계수기들은 특별한 형의 사건의 존속시간과 사건의 
발생수를 재는데 리용된다. 

M MX 등록기 

Pentium II MMX 가 여 러 가지 64 bit 자료형 을 만드는 능력 을 가지 고 있 다는것 은 이 미 
제 9장 제 4절에서 고찰하였다. MMX 명령들은 3 bit 의 등록기주소마당을 리용하여 8개의 
MMX 등록기들을 식별한다.실지로 처리장치는 전용 MMX 등록기들을 포함하고 있지 않다. 
오히 려 처 리 장치 는 뒤섞는 기 술을 리용한다(그림 11-21). 존재하는 류점수등록기 들은 
MMX 값들을 기 억하는데 리 용된 다. 
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MMX 등록기 

그림 11-21. MMX 등록기 의 류점 수등록기 로의 배 치 


이 등록기 들의 MMX 리용에 서는 다음과 같은 기 본특성 이 있 다. 

• 류점 수등록기 들은 류점 수연산을 위한 탄창으로서 취 급된 다. MMX 연산동작에 서는 
이와 갈은 등록기들에 직접 호출할수 있다. 

• MMX 명령은 임의의 류점수연산을 수행한 다음에 실행되며 FP 꼬리표단어가 유효 
하게 표식 이 불게 된다. 이 것은 등록기주소지정 을 가리키 는 탄창동작으로부터 의 
변화를 반영한다. 

• EMMS (빈 MMX 상태 )명 령 은 모든 등록기 들이 비 였 다는것 을 지 시하도록 FP 꼬리 
표단어 의 비 트들을 설정한다. 프로그람작성 자는 련속되 는 류점 수연산이 알맞게 수 
행되도록 MMX 코드블로크의 끝에 이 명령을 삽입하는것이 좋다. 

• 값을 MMX 등록기 에 쓰면 대 응하는 FP 등록기 (부호와 지 수비 트들)의 비 트들 
[79:64] 은 모두 1 로 설정된다. 이것은 류점수값으로 고찰될 때 NaN (수가 아니 
다. ) 혹은 무한대 로 FP 등록기 에 값을 설정 한다. 이 것은 MMX 자료값이 유효한 류 
점수값처 럼 보이지 않도륵 한다. 
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앞명령에 대한 내부새치기들(벡토르번히) 

외 부새 치 기(2, 32-355) 

다음명 령꺼 내 기 에서의 고장(3， 14) 

다음명 령해 신에 서 의 고장(6, 7) 

명 령 실 행 에 서 의 고장 (0,4,5,8,10〜14,16, 17) 


2. 새치기처리 

처 리 장치 에 서 새 치 기 처 리 는 조작체 계 를 지 원 하도록 제 공되 는 기 능이 다. 새 치 기 처 리 
는 각이한 새치기조건에 맞게 응용프로그람집행을 잠시 중지한후에 다시 그 실행이 회복 
되게 한다. 

새치기와 례외 

새치기와 례외는 Pentium II 가 현재 명령 흐름의 실행을 중지하고 사건에 응답하도록 
한다. 이 두 경우에 처리장치는 현재 처리의 전후상황을 보관하고 조건에 따라서 이미 
정의된 루린으로 처 리를 옳긴다. 새 치기는 하드웨 어 로부터의 신호에 의해 발생하며 프로 
그람이 실행되 는 동안 우연히 발생할수 있다. 례외는 쏘 프트웨 어 로부터 발생하며 명 령 실 
행과정에 일어 난다. 새치기와 례외에는 각각 두가지 발생원들이 있다. 

, 새 치 기 

• 금지형새치기 : 처리장치의 INTR 단자로부터 접수된다. 처리장치는 새치기가능 
기 발 (IF) 이 설정되지 않는 한 금지형새 치 기를 인식하지 못한다. 

• 비금지형새치기 : 처 리장치의 NMI 단자로부터 접수된다. 이 형의 새치기는 무조 
건 접수된다. 

■ 례외 

• 처리장치-검출례외 : 처리장치가 명령실행을 시도할 때 오유를 만나게 되면 그 
때 생긴다. 

• 프로그람화된 례외 : 례외를 발생 시키는 명 령들에 의해 생 긴다 (INTO, INT3, INT 
와 BOUND). 

새치기백토르표 

Pentium II 에서의 새 치기처 리는 새 치기벡 토르표를 리용한다. 모든 형의 새 치기 에는 
번호가 할당되며 이 번호를 새 치기벡 토르표의 첨수로 리용한다. 이 표는 256 개의 새 치기 
벡 토르들을 가지고 있다. 이것은 해 당 새 치기번호에 대 한 새 치기봉사루린의 주소(토막과 
변위) 이다. 

표 11-2 는 새 치기 벡 토르표에서 번호배 치를 보여 주고 있다. 이 표에서 그늘진 곳에 기 
입된것은 새치기，그늘이 지지 않는 곳에 기입된것은 례외를 의미한다. NMI (비금지형새 
치 기 ) 하드웨 어 새 치 기 는 형 이 2 이 다. INTR 하드웨 어 새 치 기 들은 32 로부터 255 범 위 내 의 번 
호에 할당된다. INTR 새 치기가 발생하면 이 새 치기 에 대 한 새 치기벡토르번호가 모선우에 
나타난다. 나머 지 벡 토르번 호들은 례 외 에 리 용된 다. 

하나이상의 례외 혹은 새치기가 걸리는 경우 처리장치는 예측할수 있는 순서로 이것 
들에 대한 봉사를 한다. 표내에서 벡토르번호의 위치는 우선권을 반영하지 않는다. 례외 
와 새치기들의 우선권은 5 개의 등급으로 나누어 진다. 우선권이 낮아 지는 순위로 이것 
을 고찰하면 다음과 같다. 


12 3 4 5 

급 그:！! 그：！! 그:!! 그:!! 

등 등 등 등 등 




설 명 


나누기 오유: 
오유수정례외: 


4누기자리넘침 혹은 령에 의한 나누기 

오유수정과 관련한 여러가지 고장과 내부새치기를 포함한다. 


NMI 단자새치기 : NMI 단자에 신호한다. 

중단점: INT 3 명령에ᅭ올해 일어 난다. 이 명령은 오유수정에 효과적인 
lbyte 명령이다. 

INTO - 검출자리넘침: 처리장치가 OF 기발이 설정된 상태에서 INTO 을 실 
행 할 때 일어 난다. 

BOUND 범위초과: BOUND 명 령은 기 억기 에 기 억된 경 계와 등록기를 비 
교하여 등록기의 내용이 한계를 벗어 나는 경우 새치기를 발생한다. 

조작코드를 정의하지 않는다. 

리용할수 없는 장치 : 외부장치의 부족으로 인하여 ESC 혹은 WAIT 명 령 
을 리용하려는 시도가 실패한다. 


2 중 고장: 두개의 
될수 없다. 

예약 

무효과제 상래 포착 : 
나 혹은 무효이 다. 
토막비존재: 필요힌 
탄창고장: 탄창토믹 


. 같은 명령기간에 발생하여 련속적으로 조종 


요구되는 과제를 사용하는 토막이 .초기화되지 않았거 


토막비존재 : 필요한 토막이 존재하지 않는다. 

탄창고장: 탄창토막의 경 계를 벗 어 났거 나 탄창토막이 존재하지 않는다. 
일반보호: 또 다른 례외가 일어 나지 않도록 하는 보호위반(즉 읽기만 하 
는 토막에 대 한 쓰기) 

페 지 결 함 
예약 

류점 수오유: 류점 수산수연산명 령 에 의해 발생한다 

일치검사: 기수바이트주소에 기억된 단어 혹은 4 의 배수가 아닌 주소에 

기 억된 배단어 에 대 한 호출 

기계검사: 모형규정 

예약 


새치기조종 

CALL 명령을 리용한 실행흐름에서와 같이 새치기조종루린에로의 이행은 처리장치상 
태를 기억하는 체계탄창을 리용한다. 새치기가 발생하여 처리장치에 인식되면 다음의 사 
건들이 련속적으로 일어 난다. 

• 이행 이 특권준위의 변화를 동반한다면 탄창토막등록기와 확장된 탄창지시 ( ESP ) 등 
록기 의 현재값을 탄창에 밀 어 넣는다. 

• EFLAGS 등록기 의 현재값을 탄창에 밀 어 넣는다. 

• 새 치 기 ( IF ) 및 내 부새 치 기 ( TF ) 기 발을 모두 지 운다. 이 것 은 INTR 새 치 기 와 내 부새 
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치기 혹은 단일계 단특징을 불가능으로 하기 위한것 이 다. 

• 현재코드토막 ( CS ) 지시기와 현재명령지시기 (IP 혹은 EIP ) 를 탄창에 밀어 넣는다. 

• 새 치기 가 오유코드에 의해 발생되면 오유코드를 탄창에 보관한다. 

• 새 치 기벡토르내용을 불러 내 여 CS 와 IP 혹은 EIP 등록기들에 넣는다. 실행을 새 치 
기 봉사투린 으로부터 계 속한다. 

새 치 기 로부터 의 복귀 를 위 해 새 치 기 봉사루린은 IRET 명 령 을 실 행 한다. 이 명 령 은 탄 
창에 보관된 모든 값들을 복귀시켜 새치기발생시점으로부터 실행을 재개한다. 


제 6 절 . PowerPC 처리장치 

PowerPC 처 리 장치 조직 에 대 한 총적 인 고찰은 그림 4-25 에서 진행 하였 다. 이 장에 서 
는 이 처 리 장치 의 64 bit 실현에 서 나서는 일부 구체 적 인 내 용들을 고찰한다. 

1. 등록기조직 

그림 11-22 에 PowerPC 의 사용자가 볼수 있는 등록기들을 보여 주었 다. 고점수등록 
기에는 다음과 갈은것들이 있다. 

• 일 반 : 32 개 의 64 bit 일 반등록기 들이 다. 이 등록기 들은 자료연산수들을 넣 기，기 억， 
조작하는데 리 용하며 또 등록기 간접 주소지 정 에 도 리 용할수 있 다. 등록기 0은 어 느 
정도 여러가지 목적에 리용할수 있다. 연산을 넣기 및 기억하거나 여러개의 더하 
기 명 령 에서 그의 실지내 용에 는 관계 없 이 상수값 0을 가지 는것 으로 취 급된다. 

• 례외등록기 ( XER ): 옹근수산수연산의 례외를 보고하는 3개의 비트들을 포함한다. 
또한 일부 문자렬명령에서 연산수로서 리용되는 바이트계수마당도 가진다(그림 
11-23 ᄀ ). 

류점수등록기로는 다음과 갈은 사용자가 볼수 있는 등록기들을 리용한다. 

• 일반 : 여기에는 32 개의 64 bit 일반등록기가 있으며 이것들은 모든 류점수연산에 
리용된 다. 

• 류점 수 상태 및 조종등록기 ( FPSCR ) : 이 32 bit 의 등록기 는 류점 수등록기 의 연산 
을 조종하는 비트들과 류점수연산에서 생기는 상태를 보고하는 비트들을 가진다 
(표 11-3). 

분기처리등록기로는 사용자가 볼수 있는 동록기들이 될수 있다. 

• 조건등록기 : 8개의 4 bit 조건코드마당으로 구성된다(그림 11-23 L ). 

• 련결등록기 : 이 등록기 는 목표주소의 간접주소지정 을 위한 조건분기명 령 에 리 용한 
다. 또한 호출 및 복귀동작에도 리용한다. 조건분기명 령에서 LK 비트가 설정되면 
그때 분기명 령 에 뒤따르는 주소는 련결등록기 에 넣어 지며 후에 복귀용으로 쓸수 
있 다. 

• 계수등록기 : 이 등록기는 제 9장에서 설명한바와 같이 반복고리를 조종하는데 리 
용한다. 계수등록기는 조건분기명령에서 검사될 때마다 매번 하나씩 감소한다. 이 
등록기는 분기명 령 에서 목표주소의 간접주소지정 에도 리 용된다. 
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든 옹근수산수연산명령들에 대하여 설정된다. 표 11-4 에서 보여 주 
은 연산결과가 정수，부수 혹은 령 인가를 가리킨다. 4 번째 비 트는 X ] 
!침비트를 복사한것이다. 그다음마당 ( CR 1) 은 Rc 비트가 설정되는 J 
1 대 하여 설정된다. 이 경우 4개의 비트들은 FPSCR (표 11-3) 의 첫 4 
설정된다. 결국 8 개의 조건마당 ( CRO 〜 CR 7) 은 비교명령에 리용된匕 
식별은 명령 그자체에서 규정된다. 고점수 및 류점수비교명령에서 노 
3 개의 비트들은 첫번째 연산수가 두번째 연산수보다 더 작은가, 1 
연산수와 같은가 하는것을 나타낸다. 4 번째 비트는 고점수비교인 경 




















표 11-4. 조건등록기에서 비트들의 설명 


CR 0( R c =l 인 

1 一 " 11 옹근수명령) 

CRl ( R c =l 인 
류점수명령) 

CRi (고점 수 
비 교명령) 

CRi (류점수 
비교명령) 

i 결과 <0 

I + 1 결과 >0 

I + 2 결과 =0 

1 + 3 총적 자리 넘 침 

총적례 외 
총적례외가능 
적당치 못한 연산의 
총적례 외 

자리 넘침례외 

연산수 1< 연산수 2 
연산수 1> 연산수 2 

연산수 1= 연산수 2 

총적 자리 넘 침 

연산수 1< 연산수 2 
연산수 1> 연산수 2 

연산수 1= 연산수 2 

무순서 (한 연산수가 
NaN 이 다) 


2. 새치기처리 

임 의 의 처 리 장치 에 서 와 마찬가지 로 PowerPC 는 례 외 조건에 따라서 현재 실 행 중에 
있는 프로그람을 중단할수 있는 능력을 가진다. 


새치기의 형 

PowerPC 새 치 기 에 는 일 부 체 계 조건 이 나 사건 에 의 하여 일 어 나는것 과 명 령 실 행 에 의 
하여 일어 나는것이 있다. 표 11-5 에 PowerPC 가 접수하는 새치기를 목록화하여 보여 
주었다. 

표에서 보여 준 대다수의 새치기들은 쉽게 리해할수 있다. 체계재설정새치기는 전원 
을 투입 하거나 재설정단추를 눌렀을 때 발생하는 새치기이다. 이 새치기는 체계를 재시 
동한다. 기계검사새치기는 캐쉬기우성오유나 존재하지 않는 기억기위치에 대한 참조 등 
일부 비정상적 인 현상과 관련하여 발생하는 새 치기 이다. 이 새 치 기는 체 계를 검사정지상 
태 즉 처 리 장치 의 실행 을 중지 하고 재 시동이 있을 때 까지 등록기 의 내 용들을 동결시키 는 
상태 에 들어 가게 한다. 류점수방조새 치 기는 처 리 장치 가 류점수장치 에 의하여 직접 조종 
할수 없는 연산을 완료하도록 쏘프트웨어루린을 조종할수 있게 한다. 류점수장치로 직접 
조종할수 없는 연산에는 비정규화된 수들이 나 실현할수 없는 류점수조작코드들에 의한것 
들이 속한다. 

기계상태등록기 ( MSR ) 

프로그람의 중단에 서 기 본은 새치기가 발생하였 을 때 처 리장치 의 상태 를 회복시키 는 
능력 이 다. 여 기 에는 각이한 등록기 의 내 용뿐아니 라 실행 과 관련한 각이한 조종조건들도 
포함된다. 이 조건들을 쉽게 MSR 에 모두 포함시 킬수 있다(표 11-6). 

이 등록기 에 있는 여 러 개의 비 트들을 간단히 설명 하자. 특권방식비트(비트 49) 가 설 
정되면 처 리장치는 사용자특권준위 에서 동작한다. 이때 에는 명 령모임의 한 부분묶음만을 
리용할수 있다. 이 비트가 지워 지면 처 리장치는 체계관리자특권준위에서 동작한다. 이것 
은 모든 명령들을 쓸수 있게 하며 사용자특권준위에서 호출할수 없었던 MSR 와 같은 일 
부 체 계등록기 들에 대 한 호출도 할수 있 게 한다. 

단일계단추적비트(비트 53) 가 설정되면 처리장치는 매 명령이 성과적으로 종결된후 
에 추적 새 치 기 조종기 로 조종을 넘 긴다. 분기 추적 비 트(비 트 54 ) 가 설정 되 면 처 리 장치 는 분 
기가 일어 났는가 일어 나지 않았는가에는 관계없이 매 분기명 령 이 성과적으로 종결된 
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후에 분기 추적 새 치 기 조종기 로 갈라 진다. 명 령 주소번 역 (비 트 58 ) 및 자료주소번 역 (비 트 
59 ) 비 트들은 실 지 주소지 정 이 리 용되 는가 혹은 기 억 기 관리 장치 가 주소번 역 을 수행 하는가 
를 결 정한다. 


표 11-5. PowerPC 의 새 치 기 표 


입구점 

새치기 형 

설명 

00000 H 

예 약 


00100 H 

체계재설정 

처리장치의 하드 혹은 쏘프트를 재설정할것을 외부론리에 
의해 신호한다. 

00200 H 

기계 검사 

기계검사를 인식할수 있게 되면 처리장치에 TEA #을 확인 

00300 H 

자료기억 기 

실례:자료폐지결함:호출이 적제/기억에서의 위반을 바로 
잡는다. 

00400 H 

명령기억기 

코드페지 결함: I/O 토막으로부터의 명령꺼내기를 시도하였 
다. 호출이 위반을 바로 잠는다. 

00500 H 

외부 

외부새치기를 인식할수 있게 된 경우 외부론리에 의해 농 
리 장치의 외부새 치기를 입구하는것 을 신호한다. 

00600 H 

일치 

부정합(일치하지 않음) 연산수로 인한 성공하지 못할 호출 시도 

00700 H 

프로그람 

류점수 새치기:특권명령을 실행하려는 사용자의 시도，지정 
된 조건을 만족시킬 때 실행되는 내부새치기명령,비법적인 
명령 

00800 H 

리용할수 없는 류 
점수 

류점 수장치 불가능에서 류점 수명 령 을 실 행 하려 는 시 도 

00900 H 

감소기 

외 부새 치 기 인식_ #늘할 때 감소등록기 의 고갈 

00 A 00 H 

예약 


00 B 00 H 

예약 


00 C 00 H 

체 계 호출 

체계호출명령의 실행 

00 D 00 H 

추적 

단일 계 단 혹은 분기추적 새 치 지 

00 E 00 H 

류동소수점수방조 

상대적으로 드물고 복잡한 류점수연산(즉 비정규화된 수에 
대 한 연산) 을 하려 고 하는 시도 

00 E 10 H 로부 
00 FFFFH 까 

감 예약 


01000 H 로부 
02 FFFH 까; 

si 예약 

서 (특수한 실현) 


밝은 부분: 새치기들이 명령실행에 의해 일어 남 
그늘진 부분: 새치기들이 명령실행에 의해 일어 나지 않음 


류점수 
례외 0 

류점수 
례외 1 

인식되는 새치기들 

0 

0 

인식되지 않음 

0 

1 

비정확하며 회복할수 없음 

1 

0 

비정확하며 회복할수 있음 

1 

1 

정확함 
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표 11-6. 

PowerPC 의 기계상래등록기 

비 트 

정 의 

0 

처 리 장치 가 32bit/64bit 방식 에 있 다 

1:44 

예약 

45 

전원관리 가능/불가% 

46 

실 현관계 (1520) 

47 

새치기조종기가 큰끝 혹은 작은끝배치방식에서 실행하고 있는가를 정」| 

48 

외부새치기가능/불가능 

49 

특권/비 특권상태 

50 

류점수장치 리용가능/러용불가능 

51 

기 계 검사새 치 기 가능/불가능 

52 

류점수례외방식 

53 

단일계단추적가 ♦/ 불가능 

54 

분기 추적가능/불가능 

55 

류점수례외방식 1 

56 

예약 

57 

례외주소의 맨 웃자리부분이 000h/FFFh 

58 

명령주소번역설정/차단 

59 

자료주소번역설정/차단 

60:61 

예약 

62 

새 치 기 회 복가능/회 속불가능 

63 

처리장치가 큰끝/작은끝배치방식에 있다. 

비그늘 : SSR1 에 복사됨 

그늘: SSR1 에 

복사되지 않음 


새치기조종 

새치기가 발생하여 처리장치가 그것을 인식하면 다음과 갈은 순서로 사건들이 일어 난다. 

척리장치는 보관/회 복등록기 O ( SRRO ) 에 다음에 실행되 는 명 령의 주소를 넣는다. 
이것은 명령실행에 대한 잘못된 시도로 새치기가 발생한 경우에 현재실행중에 
있는 명령의 주소로 되며 그렇지 않은 경우는 현재명령다음에 실행되는 명령의 
주소로 된다. 

*§)■ 처 리 장치 는 MSR 로부터 보관/회 복등록기 1( SRR 1) 에 기 계 상태 정보를 복사한다. 
표 11-6 에서 그늘이 없는 부분에 씌 여 진 비 트들이 복사된다. SRR 1 의 나머지 비 
트들은 새 치 기 형 에 고유한 정 보를 가지 게 된 다. 

. f ) MSR 는 새치기형에 고유한 하드웨어-정의값으로 설정된다. 모든 새치기형에 대 
하여 주소번역이 금지되고 외부새치기가 불가능하게 된다. 

*?§) 그다음 처 리 장치 는 새 치 기 조종기 에 로 조종을 넘 긴다. 새 치 기 조종기 의 주소는 새 치 
기표에 기억된다(표 11-5). 이 표의 기준주소는 MSR 의 비트57에 의해 결정된다. 

새치기로부터 돌아 올 때에는 새치기봉사루린이 rfi (새치기로부터의 되돌이) 명령을 
실행 한다. 이 명 령은 SRR 1 에 보관된 비트값들이 MSR 에 복귀되도록 한다. 실행은 SRR 0 
에 기억된 위치에서 재개된다. 
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련습문제 


1. 1. 를퓨터 에 서 8 bit 단어 로 수행 되 는 마지 막연산이 두 연산수가 각각 2 와 3 인 더 

하기였다면 다음기발의 값은 얼마인가? 

• 자리올림 

• 령 

• 자리넘 침 
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! 11-11 의 시간선도를 고찰해 보자. 두 단계의 
!한다. 이제 4개의 명령에 대하여 몇시간단위: 
다시 그리시오. 

!관흐름을 통하여 흐르고 있는 길이가 n 인 명 
무조건분기명 령 을 만나는 확률 ， q 는 분기명 령 
이 행하는 확률이 라고 하자. 그리 고 이 와 같은 
1- 날 때 진행중인 모든 명령처리를 파피하면가 
요구한다고 가정 하자. p , q 확률들을 고려 하여 

H 오. 

느름에서 분기들을 처리하는 여러흐름방법의 t 
해결되기도전에 또 다른 추가적인 분기를 만나: 
노성 혹은 부족점을 제기하시오. 

! 11-24 의 상태도를 고찰해 보자. 


상태도의 매 부분의 작용을 서술하시오. 

이 것 을 제 4절 에 서 의 분기 예 측상태 도와 비 교하 




6. Motorola 680 x 0 기계는 다음과 같은 양식의 조건에 따르는 감소 및 분기명령을 가 
지고 있다. 


DBcc Dn , displacement 

여 기서 CC 는 검사할수 있는 조건들중의 하나이 다. Dn 은 일반등록기 이며 
displacement 는 현재명 령과 관련된 목표주소를 규정 한다. 명 령은 다음과 같이 정의 
될수 있다. 
if (CC = False ) 

then begin 

Dn := ( Dn ) - 1； 

if Dn 낯% I : then PC ：= ( PC ) + displacement end 
else PC ：= ( PC ) + 2； 

명령이 실행되면 우선 고리의 종결조건이 만족되는가를 판정하기 위하여 검사된 
다. 조건이 만족되면 연산이 수행되지 않고 다음명령에 대한 실행이 차례로 계속 
된다. 조건이 만족되지 않으면 지정된 자료등록기가 감소되여 그것이 령보다 더 
작은가를 검사한다. 령보다 더 작다면 고리가 종결되고 차례로 다음명령에 대한 
실행이 계속된다. 다른 한편 프로그람은 특별한 위치로 갈라 진다. 이제 다음과 
같은 아쌤블리언어프로그람의 몇개의 렬을 생각하자. 

AGAIN CMPM.L ( A 0)1, ( Al)l 
DBNE Dl , AGAIN 
NOP 

이 명 령 렬에서는 AO 과 A 1 이 라는 주소를 가진 두개의 문자렬 이 같은가를 보기 위 
해 비교한다. 문자렬지시기는 참조를 할 때마다 증가된다. 이은 처음에 비교되는 
긴 단어 (4 byte ) 의 수를 가진다. 

ᄀ . 등록기 들의 초기 값이 A 0=$00004000， A 1=$00005000， D 1=$000000 FF ($ 는 16 진표 
기 법을 의미한다.)이 다. $4000 과 $6000 사이 기 억기 에는 단어 $AAAA 를 넣 
는다. 우의 프로그람이 실행중에 있는 경 우 DBNE 고리 가 실행 되 는 회 수와 
NOP 명 령을 만났을 때의 세 등록기들의 내용을 구하시오. 

ᄂ . $4000 와 $4 FEE 사이의 기 억기에는 $0000 를， $5000 과 $6000 사이의 기 억기 에 
는 $AAA 를 넣은 경우 자를 반복하시오. 

7. 조건분기 가 일어 나지 않는다고 가정 하고 그림 11-18 도를 다시 그리시오. 
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제 12 장. 축소명령모임콤퓨터 



♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦ 

♦ 고급언어프로그람의 집행동작에 대한 연구는 새로운 형의 처 리장치의 구성방식 인 
축소명령모임콤퓨터 ( RIS 必를 설계하는데서 지름길을 마련해 주었다. RISC 에서는 
값주기명 령문이 기본을 이루고 있으며 단순한 자료의 전송도 최적화해 야 한다고 주 
장하고 있다. 또한 많은 IF 나 LOOP 명 령 문들도 있는데 이것 들도 효과적 인 관흐름 
처 리를 수행할수 있도록 기본순서조종기구를 최적화해 야 한다고 보고 있다. 연산수 
참조현상에 대한 연구는 등록기에 적 당한 수의 연산수를 대응시켜 유지하면 성능을 
높일수 있다는것을 보여 주고 있다. 

♦ 다음과 갈은 RISC 기계의 기본특성은 이와 갈은 연구결과로부터 얻 어 진것 이 다. 

' |차 고정된 형식으로 된 제 한된 명 령모임 

m 많은 등록기 혹은 등록기사용을 최적화하는 콤파일러의 리용 
③ 명령 관흐름최 적 화의 강화 

♦ RISC 의 단순한 명령모임은 명령당 수행되는 얼마간의 연산들을 예측할수 있으므로 
효과적 인 관흐름처 리 에 적 합하다. 또한 RISC 명 령 모임 구성 방식 은 지 연분기 처 리 방법 
을 리용하는데 적 합하므로 관흐름의 효과성을 개선하는 다른 명 령들과 함께 분기명 
령을 재배 치할수 있는 우점 이 있다. 

♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦ 


387 



1950 년경에 기억프로그람콤퓨터가 개발된 때로부터 콤퓨터구성과 구성방식의 분야 
에서는 매우 놀랄만한 혁신들이 다소나마 이룩되였다. 아래에 를퓨터의 산생으로부터 시 
작하여 일부 기본적 인 진보에 대하여 개괄한다. 

• 계렬화개념 : 이것은 1964 년 IBM 이 System /360 에 도입 한것 이 다. 그로부터 얼마 
후에 DEC 가 PDP -8 에 이 개념을 도입하였다. 계 렬화개 념은 를퓨터의 구성 방식을 
그 실현과 분리시키는것이다. 여러가지 형태의 콤퓨터들은 사용자에게는 갈은 구 
성방식 을 주지 만 각이한 단가，각이한 성 능을 가진 다. 이 와 같은 단가와 성 능에 서 
의 차이 는 갈은 구성 방식 에 기 초하여 콤퓨터 를 각이하게 만들기 때 문이 다. 

• 마이크로프로그람화된 조종장치 : 1951 년에 월크스 ( Wilkes ) 에 의해 제안된것으로 
서 1964년에 IBM 이 S /360 에 도입 하였 다. 마이 크로프로그람작성 은 조종장치 의 설 
계 및 실현을 쉽게 하며 계렬화개념을 실현할수 있게 해춘다. 

• 캐쉬 : 1968 년에 IBM S /360 Model 85에 처음으로 도입되 였다. 기 억기계층에 이 
것 을 삽입한 결 과 놀라운 성 능개 선을 기 대할수 있 었 다. 

• 관흐름처 러 : 기계명 령프로그람의 본질적 인 순차속성(련속성 ) 에 병 렬처 리개 념을 
도입 한다는 의 미 를 가진다. 이 실 례 는 명 령 관흐름처 리 와 벡 토르처 리 등이 다. 

• 다중처 리 장치 : 이것은 여 러 가지 각이한 구성 들과 대상들을 망라한다. 

이 상에서 고찰한 콤퓨터 구성 방식에 는 가장 흥미 가 있으면서 도 가장 중요한 혁 신이라 
고도 볼수 있는 축소명 령 모임 콤퓨터 ( RISC ) 구성 방식 이 포함되 여 있 어 야 한다. RISC 구성 
방식은 처 리장치구성방식의 력사에서 매우 놀랄만한것 이 다. RISC 구성방식에 대한 해석 
은 일반를퓨터구성과 구성방식에서 제기되는 많은 중요한 문제점들에 중점을 두고 있다. 

RISC 처리장치를 여러 회사들에서 각이한 방법으로 그 정의를 하고 설계하였다고 해 
도 대부분 설계들에 공유된 기본요소들은 변함이 없다. 그 기본요소들은 다음과 갈다. 

• 큰 수의 일 반등록기 혹은 등록기 사용을 최 적 화하기 위한 콤파일 러 기 술의 리 용 

• 제 한된 단순한 명 령모임 

• 명령관흐름최적화의 강화 

표 12-1 에서는 여 러 가지 RISC 체 계와 비 RISC 체계들을 비 교하고 있다. 

이 장에서는 먼저 명 령모임에 대한 일부 총괄적 인 결과들을 간단히 보고 그다음 우 
에서 언급한 세가지 기본요소에 대하여 고찰한다. 


표 12-1. 일부 CISC , RISC 와 슈퍼 스칼라처 리 장치 들의 특성 



복합명 령 모임 콤퓨터 (CISC) 

축소명 령 모임 
름퓨터 (RISC) 

슈퍼스칼라콤퓨터 

특 성 

IBM 

370/168 

VAX 

11/780 

Intel 

80486 

SPARC 

MIPS 

R 4000 

PowerPC 

Ultra 

SPARC 

MIPS 

R 10000 

개발년도 

1973 

1978 

1989 

1987 

1991 

1993 

1996 

1996 

명 령 크기 ( byte ) 

208 

303 

s 

69 

94 

225 



주소지 정 

2-6 

2-57 

1-11 

4 

4 

4 

4 

4 

일반록기의 수 

16 

16 

8 

40-520 

32 

32 

40-520 

32 

조종기억기크기 
( Kbit ) 

420 

480 

246 

- 

- 

- 

- 

- 

캐 쉬 크기 ( Kbit ) 

64 

64 

8 

32 

128 

16-32 

32 

64 
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제 1 절. 명령실행특성 


콤퓨터의 발전에서 제일 눈에 뜨이는것들중의 하나는 프로그람작성언어의 발전이다. 
하드웨어의 비용은 떨어 지고 상대적으로 쏘프트웨 어의 비용은 올라 갔다. 이와 함께 프 
로그람작성 자들의 만성 화된 편향은 절대 적 으로 쏘프트웨 어 값을 올리는것 이 다. 이 로부터 
체계의 생명주기에서 기본비용은 하드웨어가 아니라 쏘프트웨어로 되고 있다. 믿음성이 
보장되지 못하고 있는 요소에는 비용뿐아니라 불편성도 있다. 다시말하여 체계 및 응용 
프로그람들인 경우 그것을 리용하는 시간이 지나감에 따라 새로운 결함들이 계속 나타나 
는것은 일반적인것이다. 

이 로부터 프로그람연구자들이 나 프로그람산업 계 는 보다 강력 하고 복잡한 고급프로그 
람작성언어를 개 발하였다.이 고급언어 ( HLL ) 들은 프로그람작성 자가 알고리듬의 세부에 
많은 주의 를 돌리 면서 보다 정 확히 표시할수 있게 한다. 또한 본성 적 으로 구조화된 프로 
그람작성 이 나 객체지향설계 를 리 용할수 있게 한다. 

이와 같은 해 결방법에서는 의미 론적 인 간격 이라고 하는 또 하나의 문제 가 생 긴다. 
의 미 론적 인 간격 은 HLL 에서 제 공하는 연산들과 콤퓨터구성 방식 에서 제 공하는 연산들사 
이의 차이를 말한다. 이 의미론적인 간격은 실행의 비효과성，지나친 기계어프로그람크기， 
콤파일 러 의 복잡성 등을 초래한다. 설 계 가들은 이 간격 을 좁히 는 구성 방식 을 개 발하는것 
으로서 이에 대답하였다. 이렇게 만들어 진 구성방식들의 기본특징은 큰 명령모임과 여 
러가지 주소지정 방식，하드웨 어로 실현된 각이한 HLL 명 령문 등을 포함하고 있는것 이 다. 
후자의 실례로서는 VAX 에서의 CASE 기계명령을 들수 있다. 이러한 복잡한 명령모임들 
은 다음과 갈은것을 실현하는것을 목적으로 하고 있다. 

• 를파일 러작성 도구를 만드는 과제 의 단축 

• 복잡한 연산순서를 마이크로코드로 실현하여 실행효과성을 개선 

• 한층 더 복잡하고 개선된 HLL 의 지 원 

한편 HLL 프로그람에서 산생되는 기계명 령실행특성과 패 런을 정 하기 위하여 많은 
연구들이 수십년간 계 속 되 였 다. 이 연구결과들은 보다 복잡한 HLL 이 아니 라 보다 단 
순한 HLL 을 지 원 하는 구성 방식 을 만들도록 하였 다. 

RISC 옹호자들의 론거 를 리 해 하기 위하여 명 령 실행 특성 을 간단히 상기해 보면 흥미 
있는 평가측면은 다음과 갈다. 

• 수행된 연산들 : 이것들은 처 리 장치 및 처 리 장치 와 기 억기의 호상작용에 의 해 수 
행되는 기능들을 결정한다. 

• 리 용된 연산수들: 연산수형 과 그 리용빈도는 연산수들을 기 억 하는 기 억기 구성과 
연산수들에 호출하는 주소지 정 방식 을 결 정한다. 

• 실행순서짜기 : 이 것은 조종과 관흐름구성 을 결정한다. 

이 절의 나머 지부분에서는 고급언어 프로그람들에 대 하여 진행한 여 러 가지 연구결과 
들을 개괄한다. 이 모든 결과들은 동적인 측정에 기초하고 있다. 즉 고급언어프로그람을 
실 행하여 일 부 특징 이 나타나거 나 특별 한 속성 이 엄 어 진 회 수를 계 수하는 방법 으로 결 
과를 수집한다. 이와는 반대 로 정적 인 측정 에서는 순수 프로그람의 원천본문에 대 하여 
이 와 갈은 계 수를 진행한다. 따라서 이 방법 은 매 명 령 문이 실행되 는 회 수와 관련한 의 
의 있는 정보를 엄지 못하므로 결국 성능에 대한 가치 있는 정보를 주지 못하게 된다. 
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1. 연산 


HLL 프로그람들의 동작을 분석 하기 위하여 여 러 가지 연구들이 진행 되 였 다. 제 4 장에 
서 고찰한 표 4-9 는 이 연구들에서 기본결과들을 보여 주고 있다. 언어와 그 응용을 함 
께 고찰한 이 연구결과들에는 좋은 조언으로 될 결과들이 적지 않다. 우선 값주기명령문 
이 많이 리용되고 있으며 이것은 단순한 자료의 이동이 매우 중요하다는것을 말해 준다. 
또한 조건명 령 문 ( IF , LOOP ) 들도 많이 리용되 고 있는데 이 명 령 문들은 일정한 부류의 
비교 및 분기명령을 가진 기계어로 실현되게 된다. 이것은 명령모임의 순서조종기구가 
중요하다는것을 말해 준다. 

이 결과들은 어떤 형의 명령문이 가장 많이 리용되며 이로부터 그 명령문에 대해서 
는《최적》양식을 반드시 구비해야 한다는것을 암시해 주므로 기계명령모임설계가들에게 
중요한것으로 된다. 그러나 이 결과들은 일반적인 프로그람의 집행에서 어떤 명령문들이 
가장 많이 리용되는가를 보여 주지 못하였다. 다시말하여 원천프로그람이 기계어프로그 
탐으로 번역된 경우 원천프로그람에서 어느 명령문들이 기계어명령실행의 대부분을 차지 
하는가를 밝혀 내지 못하였다. 

이와 같은 근본적 인 현상을 밝혀 내기 위 하여 부록 4-1 에서 서술한 Patterson 의 프 
로그람들 [ PATT 82 a ] 을 VAX , PDP -11 과 Motorola 68000 에 서 콤파일 하여 명 령 문종류마 
다 기계명령들의 평균수와 기억기참조를 평가하였다[표12-幻. 표 12-2 에서 2렬과 3렬은 
여 러 가지 프로그람들에 서 각이한 HLL 명 령 들의 상대 적 인 출현빈도를 보여 주고 있 다. 
이 값들은 원천코드에 서 명 령 문들이 발생하는 회 수를 계 수하는 방법 으로가 아니 라 프로 
그람을 실행시켜 출현회수를 계수하는 방법으로 얻은것들이다. 그러므로 동적인 빈도들 
의 통계라고 할수 있다. 4렬과 5렬의 값들 즉 기계명령들에 대한 자료는2렬과 3렬에 있 
는 매 값에 콤파일러에 의해 얻어 진 기계명령들의 수를 곱하고 그다음 그것들을 정규화 
하여 상대 적 인 출현빈도로 나타낸것 이 다. 정 규화는 HLL 명 령 문당 기 계 명 령 들의 개 수를 
고려하여 진행한다. 이 와 류사하게 6 렬과 7 렬의 값들도 매 명 령 문당 발생하는 상대적 인 
기 억기참조개수에 매 명 령문형의 출현빈도를 곱하여 엄 어 진다. 이상에서 본 4 렬로부터 
7 렬까지의 자료들은 여 러 가지 형의 명 령을 실행하는데 걸 리는 실지시 간을 대 신 측정하 
여 얻은것들이다. 이 결과들은 HLL 프로그람들에서 일반적으로 틀호출 및 복귀가 가장 
많은 시 간을 소비하는 연산이 라는것 을 보여 주고 있 다. 

표 12-2 는 전형 적 인 현재 명 령 모임 구성 방식 에 서 HLL 프로그람들을 번 역 하는 경 우 
에 HLL 프로그람에서 여 러가지 명령문형들의 중요성정도를 상대적으로 보여 주고 있 
다. 이 와는 다른 구성 방식인 경 우에 는 어 느 정 도 차이 나는 결 과들이 엄 어 질 수 있다. 
그러 나 이 연구는 오늘날의 복합명 령모임콤퓨터구성 방식 들을 대 표할수 있 는 결 과들 
을 주고 있다. 


표 12-2. HLL 연산의 상대 적 인 동적後히 PATT 82,«1 



동적 출현 

Pascal C 

기계명령 

Pascal C 

기억기참조 

Pascal C 

ASSIGN 

45 

38 

13 

13 

14 

15 

LOOP 

5 

3 

42 

32 

33 

26 

CALL 

15 

12 

31 

33 

44 

45 

IF 

29 

43 

11 

21 

7 

13 

GOTO 

- 

3 

- 

- 

- 

- 

OTHER 

6 

1 

3 

1 

2 

1 
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따라서 이 연구결과는 HLL 프로그람들에 대 한 보다 효과적 인 방도들을 찾는 사람들에 게 
어느 정도 지름길을 열어 주는것으로 될수 있다. 


2. 연산수 

연산수형의 출현에 대한 연구는 그것이 중요함에도 불구하고 훨씬 적게 진행되였다. 
그렇지만 의의가 있는 여러가지 결과들이 있다. 

이미 참고한 Patterson 의 연， [ PATT 82 a ] 역시 동적 인 변수들의 등급발생빈도를 
주의깊이 고찰하였다(표 12-3). 

표 12-3. 연산수의 동적퍼센트 



Pascal 

C 

평균 

옹근수상수 

16 

23 

20 

스칼라변수 

58 

53 

55 

배럴/구조체 

26 

24 

25 


Pasacal 과 C 프로그람들사이에 근사한 결과가 엄어 지는것은 대다수 참조가 단순한 스칼 
라변수들에서 일어 나는 경우이다. 더우기 80 %이상의 스칼라블은 틀내에서의 국부변수 
들이다. 뿐만아니 라 배렬 및 구조체 에 대한 참조는 보통 국부스칼라인 첨수 혹은 지적 자 
로 선행참조를 요구한다. 결국 스칼라들에 대 한 참조가 절대 적 인 자리 를 차지 한다. 

Patterson 의 연구는 구성 방식 과 독립 적 으로 HLL 프로그람들의 동적 인 동작을 조사 
하였다. 프로그람동작을 보다 깊이 있게 조사하자면 실제적인 구성방식에서 해야 한다. 
일부 연구자들은 DEC -10 명령들을 동적으로 조사하여 평균 매 명령 이 기억기에서는 0.5 
개의 연산수와 1.4 개의 등록기들을 참조한다는것을 밝히였다 [ LUND 77]. 이와 류사한 결 
과들이 S /370, PDP -11 과 VAX 에서 C ， Pascal , FORTRAN 프로그람들을 실행시키는 경 
우에 대하여서도 발표되였다 [ HCUK 83]. 물론 이 결과들은 구성방식，콤파일러와 깊은 
관계를 가지지만 어 디까지 나 연산수호출빈도를 보여 주고 있는데 불과하다. 

이상에서 고찰한 연구결과들은 수행되는 연산의 빈도가 높을수록 고속연산수호줄에 
알맞는 구성 방식 을 개 발하는것 이 중요하다는것을 말해 주고 있다. 특히 Patterson 의 연 
구결과는 최적화의 제 1 후보자가 국부스칼라변수들을 기억 및 호출하는 기구라는것을 보 
여 주고 있다. 

3. 틀호출 

틀호출 및 복귀 가 HLL 프로그람의 중요한 측면이 라는것은 이미 고찰하였다. 표 
12-2 를 보면 틀호출 및 복귀 가 번역된 HLL 프로그람에서 가장 많은 시 간을 소비하는 연 
산으로 되고 있다. 따라서 이 연산을 효과적으로 실현하는 방법을 고찰하는것은 매우 중 
요한 문제 로 된다. 이 문제 에서는 두가지 측면 즉 틀에 관계되 는 파라메터들과 변수들의 
수 그리고 겹놓이는 깊이가 중요하다. 

Tanenbaum 의 연구 [ TANE 78] 는 동적으로 호출된 틀들의 98 %가 6 개의 인수보다 
더 작은 인수들을 리용하며 동적으로 호출된 틀들의 92 %가 6 개의 국부스칼라변수보다 
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더 작은 변수들을 리용하였다는것을 밝히였다. 이와 류사한 연구결과들은 표 12-4 에서 
보여 준바와 같이 Berkeley 의 RISC 연구집 단에 의해서도 발표되 였다 [ KATE 83]. 이 결 
과들은 틀시동에 요구되는 단어들의 개수가 크지 않다는것을 보여 주고 있다. 그 이전에 
보고된 연구결 과들은 연산수참조의 큰 몫이 국부스칼라변수에 있 다는것 을 지 적하였 다. 
이것은 연산수참조가 사실상 상대적으로 적은 변수들로 제한된다는것을 보여 주고 있다. 

Berkeley 의 연구집 단은 또한 HLL 프로그람들에서 틀호출 및 복귀현상을 고찰하였 
다. 연구집 단은 대응하는 복귀 렬에 뒤따르는 긴 비중단틀호출의 렬은 프로그람내 에서 드 
물게 나타난다는것을 밝히였다. 오히 려 이 연구집 단은 프로그람이 틀호출깊이가 좁은 창 
문으로 제 한되 여 보존된다는것을 발견하였다. 


표 12-4. 틀인수와 국부스칼라변수 


실행된 틀 

콤파일러, 해석프로그 

작은 변수값 

호출의 퍼센트 

람，형설정기 

프로그람 

>3개 의 인수 

0-7% 

0-5% 

>5개 의 인수 

0-3% 

0% 

>8 개 의 인수 및 
국부스칼라단어 

1-20% 

0-6% 

>12 개 의 인수 및 
국부스칼라단어 

1-6% 

0-3% 


이것이 제 4 절에서 론의하여 그림 4-29 에서 설명된것이다. 이 결과로부터 연산수참조가 
매우 제한된다는 결론을 내릴수 있다. 

4. 결론 

여 러 연구집 단들은 HLL 에 밀 접 한 명 령 모임 구성 방식 을 만들려 는 시 도가 결 코 가장 
효과적인 설계전략이 아니라고 결론한것 그리고 방금전에 소제목 3 에서 결론한것 등을 
비롯하여 수많은 결과들을 발표하였다. 보통 일반적 인 HLL 프로그람들에서 가장 많은 
시 간을 소비 하는 연산특징 들의 성 능을 최 적 화하면 HLL 프로그람들을 잘 지원 할수 있 다. 

여 러 연구자들의 연구결과를 일반화하면 세가지 요소들이 RISC 구성 방식을 특징 짓 
는다고 말할수 있다. 그것은 첫째로 많은 수의 등록기를 리용하거나 혹은 등록기사용을 
최 적 화하도록 콤파일 러를 리 용하는것 이 다. 이 것은 연산수참조의 최적 화를 목적 으로 한것 
이다. 방금전에 론의한 이와 관련한 연구들은 HLL 명령당 여러개의 연산수참조가 있으 
며 여기에서도 값주기명령문이 큰 몫을 차지한다는것을 보여 주고 있다. 이것은 곧 스칼 
라변수의 국부성 및 우세성과 결합되며 보다 많이 등록기참조를 할수록 기 억 기참조가 감 
소되 여 성능을 높일수 있다는것을 말해 주고 있다. 

둘째 로는 명 령관흐름설계 에 깊은 관심 을 돌리는것 이 다. 조건분기 와 틀호출명 령들이 
실행 시 간에서 큰 몫을 차지하므로 간단한 명 령 관흐름은 비효과적 이 다. 이것은 미 리 불러 
낼수는 있지만 절대로 실행되지는 않는 명령들의 몫을 크게 해야 한다는것을 말해 준다. 

마지 막으로 축소명 령 모임 에 대 한것 이 다. 이 점 은 첫째，둘째내 용에 비 하면 명 백하지 
못한 부분이며 앞으로 론의 가 심화되면 명백해 질것 이다. 
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제 2 절. 큰 등록기파일의 리용 

제 1 절에서는 연산수고속호출의 필요성을 강조한 결과들을 개괄하였다. 또한 HLL 프 
로그탐들에서 값주기명 령문이 큰 몫을 차지하며 이 값주기명 령문들중의 대 다수는 A ᅳ B 
의 단순한 형태 라는것을 보았다. HLL 명 령문마다 하나이상의 연산수호출들도 있다. 이 
결 과들을 대 다수 호출명 령 이 국부스칼라변수를 가진 다는 사실과 결부시 키 면 등록기 식 기 
억기에 대한 믿음성이 더욱 커지게 된다. 

등록기식기억기를 리용하는 리유는 이것 이 주기억기 나 캐쉬보다 더 빠른 가장 고속 
인 기억기이기때문이다. 등록기파일은 ALU 나 조종장치와 동일한 소편우에 있는 물리적 
으로 작은것 이며 따라서 가장 빈번히 호출해 야 할 연산수들은 등록기에 보존하여 등록기 
와 기 억기사이 연산을 최소로 하는 전략이 필요하다. 

여 기 에는 두가지 기 본방법 이 있다. 하나는 쏘프트웨어 에 의한것 이 고 다른 하나는 하 
드웨어 에 의한 방법 이 다. 쏘프트웨 어방법은 를파일 러 에 등록기를 최대 로 리용하도록 의 
뢰하는 방법 이 다. 콤파일 러 는 등록기 들을 주어 진 시 간동안에 제 일 많이 리 용되 는 변수 
들에 할당한다. 이 방법 은 고급한 프로그람一해 석알고리 듬을 리 용하는것 을 전제 로 한다. 
하드웨 어방법 은 보다 많은 변수들을 오랜 시 간동안 등록기 에 유지할수 있도록 단순히 더 
많은 등록기들을 리용하는 방법 이 다. 

이 절에서는 하드웨어방법을 기본으로 고찰한다. 이 방법은 Berkeley 의 RISC 연구 
집 단에 의 해 제 안되 였 으며 [ PATT 82 a ] 첫 RISC 상품인 Pyramid 에 리 용되 였 고 
[ RAGA 83] 현재 일 반 SPARC 구성 방식 에 도 리 용되 고 있 다. 

1. 등록기창문 

얼핏 보기 에도 큰 규모의 등록기들을 리용하면 기 억기호출에 대 한 요구가 감소될것 
갈다. 설 계 과제 는 이 목적 을 실 현 할수 있는 방향에 서 등록기 들을 구성하는것 이 다. 

대 다수의 연산수참조가 국부스칼라에 있으므로 한가지 명백한 방법은 전역변수로 예 
약된 몇개의 등록기들을 포함한 등록기들에 국부스칼라들을 기억하는것이다. 문제는 국 
부의 정의가 매 틀호출 및 복귀，빈번히 일어 나는 연산들에 따라서 변하는것이다. 모든 
호출에서 국부변수들은 등록기로부터 기억기로 옮겨 보관되여 이 등록기들을 호출한 프 
로그람이 다시 리용할수 있게 해 야 한다. 뿐만아니 라 파라메터들을 넘길 때 에도 등록기 
들을 리용해야 한다. 또한 어미프로그람의 변수들을 등록기에 넣어야 하며 결과를 어미 
프로그람으로 넘겨 야 한다. 

이것은 이미 제 1 절에서 고찰한 다음의 두가지 서로 다른 결과들에 기초하면 된다. 
첫째로，일반적으로 틀은 몇개의 넘기기파라메터들과 국부변수들만을 리용한다(표 12-4). 
둘째로，틀시동의 깊이는 상대적으로 좁은 범위내에 영향을 미친다(그림 4-29). 이 속성 
들을 리용하자면 여 러개의 작은 모임 으로 된 등록기 들을 리 용해 야 하며 여 기서 매 작은 
모임 의 등록기 들은 각이한 틀에 할당할수 있 어 야 한다. 틀호출은 처 리 장치 가 각이한 등 
록기 로 된 고정크기의 창문을 자동적 으로 리용하도록 한다. 

결국 린접틀들의 창문들이 파라메터를 통과시 킬수 있게 서로 겹놓이게 된다. 이와 
같은 개념을 그림 12-1 을 통하여 보여 주고 있다. 임의의 순간에는 오직 하나의 등록기 
창문만을 볼수 있으며 마치 이 등록기창문이 유일한 등록기모임인듯이 보고 주소화할수 
있다(실례 로 주소 0부터 N -1 까지). 창문은 3개의 고정크기령역 으로 나누어 진다. 파 
라메터등록기들은 현재틀을 호출한 틀로부터 넘어온 파라메터들을 가지며 또 거꾸로 
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그림 12-1. 겹놓이는 등록기창문 

넘 겨 주어 야 할 결과를 가지 기도 한다. 국부등록기 들은 콤파일 러 에 의해 할당될 때 국부 
변수로 리용된다. 림시등록기들은 다음의 보다 낮은 준위 (현재 틀에서 호출한 틀) 와 파 
라메터 및 결 과를 교환하는데 리 용된 다. 한 준위 에 있는 림 시등록기 들은 물리 적 으로 그 
다음 낮은 준위 에 있는 파라메터등록기 들과 같이 볼수 있다. 이 겹 놓임 은 파라메터 들을 
자료의 실지이동이 없이 넘기도록 한다. 

임의의 호출 및 복귀패 런들을 조종하자면 등록기창문의 수를 제 한하지 말아야 한다. 
대 신 얼 마 안되 는 최 신틀시 동들만을 가지 도록 등록기창문을 리 용해 야 한다. 이 때 그 이 전 
의 낡은 틀시동들은 기억기에 보관하거나 겹놓이는 깊이가 감소되면 후에 등록기창문에 
복귀 시 켜 야 한다. 결 국 등록기 파일 의 실지 구성 은 창문들이 겹 놓이 는 원형완충기 와 갈다. 
이 구성 을 그림 12-2 에 보여 주었 다. 
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그림 12-2. 중첩된 창문들의 원형-완충 




이 그림에서는 6 개의 창문을 가진 원형완충기를 보여 주고 있다. 완충기는 틀 D 가 능동 
(동작중)인 경우 4의 깊이로 채워 진다(쇼는 묘를 호출， B 는 C 를 호출， C 는 D 를 호출). 
현재 창문지 시 기 ( CWP ) 는 현재 능동틀의 창문을 가리킨다. 기 계 명 령 에 의한 등록기참조는 
이 지 시 기 가 실 지 물리 등록기 를 가리 키 도록 변위 된 다. 보관창문지 시 기 ( SWP ) 는 기 억 기 에 
제일 마지막으로 보관된 창문을 식별해 준다. 

이제 틀 D 가 틀 E 를 호출하였다면 표의 인수들은 D 의 림시등록기들에 놓이게 되며 
( W 3 과 W 2 사이의 겹놓임 ) CWP 는 한 창문 전진하게 된다. 그다음 틀 E 가 틀 F 를 호 
출하면 이 호출은 현재의 완충기상태 에는 부합될수 없다. 그것은 표 의 창문이 A 의 창문 
과 겹놓일수 있기 때 문이 다. 만일 F 가 틀호출을 위 해 준비한 그의 림 시 등록기들에 넣 기 
를 시 작한다면 a 의 파라메터등록기 ( A . in ) 에 겹 쳐 써 질것 이다. 따라서 SWP 와 같아 질 
때까지 CWP 가 증가되면 새 치기 가 발생하여 A 의 창문이 보관된다. 실례로 표 의 시동에 
뒤 이 어 B 가 A 로 되돌아 오면 CWP 는 감소되여 SWP 와 같아 지게 된다. 이것은 A 창 
문의 복귀 로부터 초래 되 는 새 치 기 를 발생 시 킨 다. 

이 상과 갈은 고찰로부터 N 창문등록기파일 은 N -1 개 의 틀시 동만을 가질 수 있 다는것 
을 알수 있 다. 이 때 N 의 값은 크지 말아야 한다. 부록 4-1 에 서 이 미 언급한바와 같이 8 
개의 창문을 가지면 보관 혹은 회복이 호출 혹은 복귀의 1 %정도로 된다 [ TAMI 83]. 
Berkeley 의 RISC 를퓨터는 매 창문이 16개의 등록기로 된 8개의 창문을 리용하고 있으 
며 Pyramid 콤퓨터는 매개 가 32 개의 등록기 인 16 개의 창문을 가지고 있다. 

2. 전역변수 

앞에서 서술한 창문방식은 등록기들에 국부스칼라변수들을 기 억하는 효과적 인 구성 
을 준다고 말할수 있다. 그러나 이 방식은 하나이상의 틀에서 호출하는 전역변수들을 기 
억해야 할 요구는 만족시키지 못한다. 전역변수에 대하여서는 다음과 같은 두가지 방식 
이 제 안되고 있다. 첫째로 HLL 에서 전역변수로서 선언된 변수들이 콤파일러 에 의해 기 
억기위치 에 할당되 고 이 변수들을 참조하는 모든 기계명 령들이 기 억기一참조연산수들을 
리 용하는 방식 이 다. 이 방식 은 하드웨 어 나 쏘프트웨 어 (콤파일 러 ) 견지 에 서 볼 때 모두 간 
단한 방법 이 다. 그러 나 전역변수의 호출빈도가 같을 때 에는 비 효과적 인 방식 으로 된다. 

다른 하나의 방식 은 처 리 장치내 에 전역 등록기 모임 을 공존시 키 는것 이 다. 이 때 이 등 
록기 들은 총적 으로 고정 되 며 모든 틀들에 리 용할수 있 다. 단일 번 호달기 방식 (unified 
numbering scheme ) 은 명령형식을 간단히 하는데 리용한다. 실례로 0 부터 7 까지 번호 
가 불은 등록기들에 대한 참조는 갈은 전역등록기에 귀 착시 킬수 있으며 등록기 8 로부터 
등록기 31까지의 참조는 현재 창문에서 물리등록기들에 귀착되도록 변위시킬수 있다. 결 
국 등록기주소지정에서 분할을 알맞게 하자면 하드웨어부담을 증가시켜야 한다. 뿐만아 
니라 를파일러가 어느 전역변수를 어느 등록기에 할당해야 하는가를 결정해야 한다. 

3. 큰 등록기과일과 캐쉬의 비교 

창문으로 구성된 등록기파일은 가장 널리 리용되는 변수들의 부분모임을 보존하기 
위한 작고 빠른 완충기로서 작용한다. 이러한 관점에서 보면 등록기파일이 캐쉬와 매우 
류사하게 작용한다고 볼수 있다. 이로부터 캐쉬와 등록기파일을 리용할 때 어느것 이 더 
간단하며 또 더 좋겠는가하는 의문이 생긴다. 

표 12-5 는 이 두 장치 들의 특성 을 보여 주고 있 다. 창문에 기 초한 등록기파일 은 최 
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신 N -1 개의 틀시동에 필요한 모든 국부스칼라변수들을 가진다(드물게 일어 나는 창문의 
자리넘 침은 제 외 ). 캐쉬는 마지막으로 리용되는 스칼라변수들중의 어 느 하나를 선택하여 
가진다. 등록기파일 에 는 늘 모든 국부스칼라변수들이 보존되 여 있으므로 시 간을 절 약한 
다. 다른 한편 캐쉬는 동적으로 기억공간의 포화를 막으므로 기억공간을 보다 효과적으 
로 리용할수 있게 한다. 게 다가 캐쉬는 일반적으로 명령 및 다른 형의 자료들을 포함하 
는 모든 기 억 기참조를 동일 하게 취 급한다. 따라서 이 것 들을 다른 령역 으로 보관하는것 은 
캐쉬 에서만 가능하며 등록기파일에서는 불가능하다. 


표 12-5. 큰 등록기파일과 케쉬구성의 특성 


큰 등록기파일 

캐 쉬 

모든 국부스칼라들 

최신리용국부스칼라들 

개별적인 변수들 

기억기블로크 

를파일러할당전역변수들 

최신리용전역변수들 

틀겹놓임깊이에 기초한 보관/회복 

캐 쉬 재 배 치 알고리 듬에 기 초한 보관/복귀 

t 록기 주소지 정 

기억기주소지 정 


등록기파일은 공간을 비효과적 으로 리용하게 되 는데 그것 은 틀들이 자기 에 게 분배 된 
전체 창문공간을 다 리용하지 않기때문이다. 한편 캐쉬는 자료를 블로크단위로 읽어들 
이는 또 하나의 비효과성을 가진다. 등록기파일은 리용중에 있는 변수들만을 가지지만 
캐쉬는 리용되지 않는 일부 혹은 대부분의 자료를 블로크로 읽는다. 

캐 쉬 는 국부변수들은 물론 전역변수들도 조종할수 있 다. 보통 많은 전역스칼라들이 
있지만 그것들중 몇개만이 자주 리용된다 [ KATE 83]. 캐쉬는 동적으로 이 변수들을 발견 
하여 보유한다. 창문에 기 초한 등록기파일 이 전역 등록기 로 보충되 면 그것 역 시 일부 전 
역스칼라들을 가질수 있다. 그러나 콤파일러가 어느 전역변수가 자주 리용되는가를 결정 
하기는 힘들다. 

등록기파일 인 경우 등록기와 기 억기사이 자료이동은 틀이 겹놓인 깊이 에 의해 결정 
된다. 이 깊이는 보통 좁은 범위내 에서 변동하므로 기 억 기 리용은 상대적 으로 빈번하지 
못하다. 대다수 캐쉬들은 작은 크기의 묶음이 되도록 설정된다. 따라서 다른 자료 혹은 
명령들이 자주 리용되는 변수들과 겹쳐 써질 위험성이 있다. 

지금까지 론의한 내용에 기초하여 보아도 아직 큰 창문에 기초한 등록기파일과 캐쉬 
사이의 차이점은 명 확하지 못하다. 그러 나 등록기방식 이 명백 히 더 우월하며 여기서 캐 
쉬 에 기초한 체계 가 등록기방식보다 현저히 속도가 뜰것 이 라는것 이 하나의 특징으로 된 
다. 이 차이는 두 방식들에서 주소지정에 간접적으로 소비되는 시간에서도 나타난다. 

그림 12-3 은 이 차이 를 그림 으로 설명해 주고 있 다. 창문에 기 초한 등록기파일 에서 
는 국부스칼라를 참조하기 위하여《가상》등록기번호와 창문번호를 리용한다. 이 번호들 
은 물리등록기 들중의 어 느 하나를 선택하는 상대 적 으로 단순한 해 신기 들을 통과한다. 캐 
쉬 에서는 기 억기위치를 참조하기 위하여 전체 주소모선에 기 억기주소를 발생해 야 한다. 
이 연산의 복잡성은 주소지정방식에 관계된다. 하나의 묶음으로 된 캐쉬에서는 주소의 
한 부분을 묶음크기 와 갈은 여 러 개의 단어 들과 꼬리 표들을 읽 는데 리용한다. 이 부분을 
제외한 주소의 다른 부분은 꼬리표와 비교되 여 읽은 단어들중에서 어느 하나를 선택한다. 
캐 쉬 가 등록기파일 만큼 빠르다고 해 도 호출시 간이 상당히 더 길 다는것 은 명 백한것 이 다. 
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따라서 성능의 견지에서 보면 국부스칼라인 경우는 창문에 기초한 등록기파일이 더 우월 
하다. 특히 명령의 경우에는 여기에 캐쉬를 추가하면 성능을 더 개선할수 있다. 

명령 


등록기 


_ I » 자료 

fwf| - 니 1 可可一 | ―I | 


명령 



그림 12-3. 스칼라참조 

1- 창문에 기 초한 등록기 파일，캐쉬 


제 3 절. 콤파일러에 기초한 등록기최적화 

이제 작은 수 즉 16〜32개의 등록기들만을 RISC 기계에서 리용할수 있다고 하자. 이 
경 우 등록기 를 얼 마나 최 적 으로 리용하는가 하는것 은 콤파일 러 의 믿 음성 에 달려 있 다. 
물론 고급언어로 작성된 프로그람에서는 등록기들을 명시적으로 참조하지 않는다. 오히 
려 프로그람의 파라메터들을 기호로 표시한다. 콤파일러의 목적은 주기억기가 아니라 등 
록기 에 가능한껏 많은 계산을 할수 있는 연산수를 대응시키며 또 넣기 및 기 억연산을 최 
소로 하는것 이 다. 

이 를 위하여 일 반적 으로 취 해 지 는 방법 은 다음과 갈다. 등록기내 에 존재하는 모든 
프로그람의 파라메터는 기호 혹은 가상등록기 에 배 치되게 된다. 그다음 콤파일러는 이 러 
한 무수히 많은 기 호등록기 들을 고정 된 수의 실 지등록기 로 바꾼다. 기 호등록기 들은 그 
사용이 겹치지 않지만 실지 등록기를 공유할수 있다. 프로그람의 특별한 부분에 처리해 
야 할 파라메터 들이 실지 등록기보다 더 많은 경우에 는 일부 파라메터들이 기 억기위치 에 


397 




배치되게 된다. 넣기 및 기억명령들은 연산을 위하여 림시로 등록기들에 파라메터들을 
위치시키는데 리용된다. 

최적화과제의 본질은 프로그람내의 임의의 주어 진 위치에서 어느 파라메터들이 등 
록기 들에 넘 겨 지게 될것 인가를 결정하는것 이 다. RISC 콤파일 러 에서 가장 일 반적 으로 리 
용되고 있는것은 위상기하학의 원리로부터 받아 들인 기술인 도형색칠하기 (graph 
coloring ) 이 다 [ CHAI 82, CHOW 86, COUT 86, CHOW 90]. 

도형색칠하기는 다음과 같이 진행한다. 마디와 변으로 구성되는 하나의 그라프가 주 
어 지면 린접마디들이 서로 다른 색을 가지도록 마디들에 색을 할당하며 이 할당은 서로 
다른 색의 수가 최소로 되도록 하는 원칙에서 한다. 이 문제를 다음과 갈은 방법으로 콤 
파일 러문제 와 대 응시 킬수 있 다. 우선 프로그람을 분석 하여 등록기호상관계그라프를 그린 
다. 그라프의 마디들은 기호등록기들에 해 당한다. 두개의 기호등록기 가 같은 프로그람조 
각내에 존재한다면 등록기호상관계를 묘사하기 위해서 변으로 련결한다. 그다음 n 개의 
색을 가지고 그라프를 색칠한다. 여기서 n 은 등록기의 수이다. 같은 색을 공유하는 마디 
들은 갈은 등록기로 할당된다. 이 처리가 완전히 성공하지 못하면 색칠이 안된 마디들은 
기 억기에 배치하여 영향을 받은 파라메터들을 위한 공간을 만들어 넣기와 기억 이 필요할 
때 리용할수 있게 해 야 한다. 

그림 12-4 는 이 러한 처 리의 간단한 실례 이 다. 그림에서는 3 개의 실지등록기들로 번 
역되는 6 개의 기호등록기들을 가진 프로그람을 가정하고 있다. 그림 12-4 자는 매 기호 
등록기 실지리 용의 시 간순서 를 보여 주고 있으며 그림 12-4 l 는 등록기호상관계그라프 
(그늘진 부분과 사선친 부분은 색갈대신으로 리 용하였 다. )를 보여 주고 있 다. 그림 에 서 
는 세 가지 색 갈로 색 칠을 하였다. 그림 에는 F 라는 하나의 기 호등록기 가 색 을 칠하지 않 
은채로 남아 있는데 이것은 넣기 및 기억을 리용하여 처리해야 한다. 



일반적으로 큰 등록기모임의 리용과 콤파일러에 기초한 등록기최적화사이에는 합리 
적 인 방안이 있다. [ BRAD 91 a ] 는 Motorola 88000, MIPS R 2000 과 류사한 특징 을 가진 
RISC 구성방식을 모형화한 연구결과에 대하여 보고하고 있다. 여기서는 등록기수를 16으 
로부터 128 까지 변화시키면서 모든 일반등록기들의 리용과 옹근수 및 류점수리용에서의 
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등록기분할 등을 고찰하였다. 이 연구결과는 단순한 등록기최적화에서 64 개 이상의 등록 
기를 리용하면 우점이 적어 진다는것을 보여 주었다. 합리적이며 고급한 등록기최적화기 
술인 경 우 32개 이 상의 등록기 이 면 가장 좋은 성 능개 선을 얻 을수 있 다. 결 국 이 연구결과 
들은 작은 수의 읽기등록기들(례로 16) 을 가지면 공유등록기구성을 가진 콤퓨터들이 분 
할구성을 가진 콤퓨터들보다 더 빨리 명령을 실행한다는것을 말해 준다. 이와 류사한 결 
과들이 여 러 연구자들에 의 해서도 발표되였으몌 HUGU91] 이 결과들은 모두 기 본적 으로 
작은 수의 등록기 들을 리 용한 최 적 화에 귀 착된 다. 

제 4절. 축소명령모임구성방식 

이 절에서는 축소명령모임구성방식의 필요성과 일부 일반적인 특성에 대하여 고찰한 
다. 먼저 현대복합명령모임구성방식의 필요성에 대하여 론의한다. 

1. 복합명령모임구성방식의 필요성 

이미 앞에서 많은 명 령들과 복잡한 명 령들을 포함하는 보다 풍부한 명 령모임 에 대 한 
경향을 고찰하였다. 이러한 경향은 두가지 원리적인 리유 즉 콤파일러를 간단하게 하려 
는 요구와 성능을 개선하려는 요구로부터 나온것이다. 이 두가지 리유의 바탕에는 프로 
그람작성자들이 고급언어를 주로 리용하며 구성방식설계가들이 HLL 프로그람들을 더 잘 
지원할수 있게 하는것이 있다. 

이 장의 목적은 CISC 설계가들이 방향을 잘못 잡았다는것을 말하려고 하는것 이 아니 
다. 기술이 끊임 없이 발전하고 콤퓨터구성 방식 이 두개의 정연한 종류가 아니 라 여 러가지 
종류로 존재하고 있으므로 흑백평가가 정확하지 않다. 따라서 뒤에서는 CISC 방법이 포 
함하고 있는 부족점들을 지적 하고 RISC 지지 자들의 립장에 대 한 일부 정확한 리해를 설 
명 한다. 

앞에 서 언급한 첫 번째 론거 즉 콤파일 러 의 간단화는 명 백하다. 를파일 러작성 도구를 
만들기 위한 과제 는 매 HLL 명 령 문에 대 하여 기 계 명 령렬을 발생 시키 는것 이 다. 만일 
HLL 명 령문들과 비슷한 기계명령들이 있다면 이 과제는 간단히 해결된다. 여 러 RISC 연 
구자들이 이 문제를 고찰하였다 ([HENN8 幻， [RADI83] , [PATT82b]). 그들은 콤파일러 
가 그 구조를 정확히 맞추는 경우를 반드시 찾아야 하므로 복잡한 기계명령의 개발이 매 
우 힘 들다는것 을 밝히 였 다. 발생한 코드를 그 크기 가 최 소로 되 도록 최 적 화하기 위 한 과 
제는 명령실행량을 줄이는것이며 관흐름처리의 성능제고는 복잡한 명령모임인 경우 훨씬 
더 힘들다. 이 장의 맨 앞에서 이미 인용한 연구들은 번역된 프로그람에서 대다수의 명 
령 들은 상대 적 으로 단순한 명 령 들이라는것 을 보여 주었 다. 

두번째 론거 의 요점 은 CISC 가 더 작고，더 고속인 프로그람을 산생할것 이 라는 기 대 
이 다. 이 주장의 두가지 측면 즉 프로그람이 보다 작으며 프로그람이 보다 고속으로 실 
행될것이라는 주장을 고찰해 보자. 

우선 보다 작은 프로그람에는 두가지 우점 이 있다. 하나는 적은 기 억기를 가지므로 
그 자원이 절 약된다는것 이 다. 오늘날 기 억기비용이 매우 눅어 진것을 고려하면 이 우점 
은 더는 지속되지 못할것이라고 본다. 다른 하나의 중요한 우점은 보다 작은 프로그람이 
성능을 개선한다는것인데 그 리유는 다음과 같다. 첫째로，보다 작은 명령들은 불러 들여 
야 할 보다 작은 수의 명 령 바이 트들을 의 미하며 둘째 로，페 지 화환경 에 서 보다 작은 프로 
그람은 폐지 결함을 감소시 키 면서 보다 적 은 폐지 를 차지한다. 
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이와 같은 론거에서 문제는 CISC 프로그람이 대응하는 RISC 프로그람보다 더 작을것 
이라는 추측이 맞지 않는것이다. 기호기계어로 표시된 CISC 프로그람은 더 작은 명령들 
을 가지 지 만 그것 이 차지 하는 기 억 기비 트수는 현저 히 더 작아 지 지 않는다. 표 12-6 에는 
축소명 령 모임 구성 방식의 RISC I 를 포함하여 여 러 가지 를퓨터들에 서 번역된 C 프로그람의 
크기 를 비교한 결과들을 보여 주고 있다. 이 표로부터 RISC 프로그람에서 보다 CISC 프로 
그람을 리용하는 경 우 약간의 절 약이 있거 나 거 의 절 약이 없 다는것 을 알수 있 다. 특히 
흥미 있는것은 PDP -11 보다 훨씬 더 많은 복잡한 명령모임을 가지는 VAX 가 PDP -11 보 
다는 매우 적은 기 억기 령 역절약을 가져 온다는것 이 다. 이와 갈은 결과들은 IBM 연구자들에 
의해 확증되였다 [ RADI 83]. 그들은 IBM 801 이 IBM S /370 코드크기의 0.9 배정도의 코드 
를 가진다는것을 밝혔으며 이 연구는 PL/I 프로그람의 명령모임을 가지고 진행하였다. 

이러한 놀라운 결과들에는 여러가지 원인들이 있을수 있다. 이미 CISC 의 콤파일러 
들이 보다 단순한 명령들에 알맞게 되여 있으므로 복잡한 명령들의 간결성이 드물게 나 
타난다는것을 보았다. 또한 CISC 에서는 보다 많은 명 령들이 있으므로 긴 조작코드가 필 
요하며 이것은 긴 명 령을 낳는다. 결국 RISC 는 기 억기참조가 아니 라 등록기참조를 강화 
하기 쉬우며 이것은 보다 적은 비트들을 요구한다. 

이상과 갈은 고찰로부터 CISC 가 더 작은 프로그람을 산생할것 이 라는 기 대는 실현될 
수 없 다. 복잡한 명 령 모임 들에 서 의 두번째 자극인 자는 명 령 실 행 이 더 빠를것 이 라는것 이 
였다. 이것은 복잡한 HLL 연산이 보다 원시적인 명령들의 렬에서보다는 단일한 기계명 
령에서 더 빨리 실행될것 이 라는 느낌 을 준다. 그러 나 보다 단순한 명 령들의 리 용을 지 향 
하므로 이것은 그렇게 될수는 없다. 전체 조종장치가 더 복잡하게 구성되므로 마이크로 
프로그람조종기억 을 보다 풍부한 명 령 모임 에 맞게 더 크게 구성해 야 한다. 


표 12-6. 

RISC I 와의 상대 적 인 

코드크 7 1 



11 개 의 C 프로그람 
[PATT82a] 

12 개 의 C 프로그람 
[KATE83] 

5 개의 C 프로그람 
[HEAT84] 

RISC I 

1.0 

1.0 

1.0 

VAX-11/780 

0.8 

0.67 


M68000 

0.9 


0.9 

Z8002 

1.2 


1.12 

PDP-11/70 

0.9 

0.7 



일부 연구자들은 복잡한 명령실행에서 속도상승이 고속조종기억기에 이 명령들을 상 
주시 키 는데 있 는것 이 아니 라 복잡한 기 계 명 령 들의 능력 에 있 다는것 을 밝히 였 다 [RADI 
83]. 결 과적 으로 조종기 억 기 는 명 령 캐 쉬 로서 작용한다. 따라서 하드웨 어 설 계 가들은 어 느 
부분루린 혹은 어느 함수들이 가장 빈번히 리용되는가를 결정하고 이것들을 마이크로코 
드로 실현하여 조종기억기 에 할당해 야 한다. 이 결과는 아직 불충분하다. S /390 체계 에서 
번역 및 확장된 정확도 류 점수나누기와 갈은 명령들은 고속기억기에 상주시키며 한편 틀 
호출을 설 정 하거 나 새 치 기 조종기 를 초기 화할 때 동반되 는 명 령렬 들은 보다 속도가 뜬 주 
기억기에 위치시킨다. 

결국 매우 복잡한 명령모임을 지향하는것이 합리적이라고 보기는 힘들다. 이러한 사 
실 들은 많은 연구집 단들이 이 와는 반대 의 길 을 모색하게 하고 있 다. 
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2. 축소명령모임구성방식의 특성 

축소명 령모임구성 방식에는 여 러가지 가 있지만 이것들은 모두 공통적으로 다음과 같 
은 특성을 가지고 있다. 

• 주기당 하나의 명령 

• 등록기 대 등록기연산 

• 단순한 주소지정방식 

• 단순한 명령형식 

이 특성들을 차례로 고찰해 보자. 

첫번째 특성은 기계주기당 하나의 기계명령이 있다는것이다. 여기서 기계주기는 등 
록기로부터 2 개의 연산수를 불러 내여 ALU 연산을 수행하고 그 결과를 등록기에 기억 
하는데 걸리는 시 간으로 정의된다. 따라서 RISC 기계명 령들은 CISC 콤퓨터들에서의 마이 
크로명령보다는 고급하지 못하지만 그만큼 빨리 실행된다. 간단히 하나의 기계주기를 생 
각하면 이때 마이크로코드는 거의나 필요 없게 된다. 이러한 명령들은 콤퓨터들에서의 
다른 기계명령들과 비교해 볼 때 더 빨리 실행될수 있다. 그것은 명령을 실행하면서 마 
이 크로프로그람조종기억기의 호출이 필요 없기때 문이 다. 

두번째 특성은 대부분의 연산이 기 억기를 호출하는데 단순히 넣기 및 기 억연산만을 
리 용하는 등록기 대 등록기연산이 라는것 이 다. 이 특징 은 명 령 모임 을 간단하게 하며 따라 
서 조종장치도 단순하게 한다. 실례로 RISC 명령모임은 하나 혹은 두개의 ADD 명령 즉 
옹근수더 하기 와 자리올림 을 고려한 더 하기 명 령 을 가지 고 있지 만 VAX 는 25 개 의 각이한 
더하기명령을 가지고 있다. 설계특징은 또한 이러한 구성방식이 등록기를 최적으로 리용 
하게 하며 자주 호출되는 연산수들을 고속기 억기에 보유한다는것 이 다. 

이 와 같은 등록기 대 등록기연산의 강화는 RISC 설계 에서 만 찾아 볼수 있는 유일한 
것이다. 다른 현대콤퓨터들에서도 이러한 명령들을 가지고 있지만 이외에도 기억기 대 
기억기연산，혼합된 기억기 및 등록기연산들도 포함하고 있다. 이러한 방법들에 대한 비 
교는 RISC 가 출현하기전인 1970 년대에 진행되였다. 그림 12-5 에서는 기억기 대 기억기 
연산과 등록기 대 등록기연산을 비 교하고 있다. 여 기서는 가상적 인 구성 방식 에 대 하여 
프로그람크기와 기 억기호출비트수를 평 가하였다. 이 과정 에 어떤 연구자는 미 래의 구성 
방식 이 등록기 들을 전혀 포함하지 않을것 이 라는것 을 제 기하였 다 [ MYER 78]. 이 때 사람들 
은 이 사람이 과연 그때 528개의 등록기를 가진 Pyramid 라는 이름으로 된 RISC 콤퓨터 
가 이미 나와 있다는것을 생각하였을가 하고 의심스럽게 생각하였다. 

이들은 우선 작은 수의 국부스칼라들에 대한 호출이 매우 빈번하다는것을 인식하지 
못하였으며 큰 묶음의 등록기 혹은 최적화된 콤파일러를 가지게 되면 대다수 연산수를 
오랜 시 간 등록기 에 유지할수 있다는것을 몰랐다. 이것을 고려 한 비 교를 그림 12-5 u 에 
보여 주었다. 

세 번째 특성 은 단순한 주소지 정 방식 의 리용이 다. 거 의 모든 RISC 명 령 들은 단순한 
등록기 주소지 정 방식 을 리 용한다. 변위 나 PC 상대 와 같은 여 러 가지 추가적 인 방식 들도 리 
용할수 있 다. 이 보다 더 복잡한 방식 들은 단순한 방식 들을 쏘프트웨어 로 합성하여 엄 을 
수 있다. 이 특성은 명 령모임과 조종장치를 간단하게 한다. 

마지 막 네번째 특성 은 단순한 명 령형 식의 리용이 다. 일 반적 으로 RISC 에서 는 하나 
혹은 몇개의 형식들만 리용된다. 명령길이는 고정되며 단어경계로 배치된다. 마당의 위치 
특히 조작코드는 고정이다. 이 특징은 여러가지 리익을 가져다 준다. 고정된 마당을 가지 
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게 되면 조작코드해신과 등록기연산수호출이 동시에 일어 날수 있다. 단순화된 형식은 
또한 조종장치를 간단하게 한다. 명 령꺼내기는 단어길 이 단위로 진행되므로 최적 화된다. 
단어단위의 값주기는 또한 단일명령이 폐지경계를 가로 지르지 않는다는것을 의미한다. 


8 

16 16 16 

8 

4 

16 

Add | 

B | C | A 1 

Load 

rB 

B 

기억 기 대 기억 기 

1 = 56, D = 96, M = 152 

T ) 

Load 

rC 

B 

Add 

rA 

rB | rC | 

Store 

rA 

A 


등록기 대 기억기 



기억기 대 기억기 
1=168 ， D = 288, M = 456 


등록기 대 기억기 
1=104, D =96, M =200 


I - 확장명령의 크기 
D - 확장자료의 크기 
M = I + D - 총기 억 기 통신 량 


그림 12-5. 부가지 등록기 대 등록기와 기 억기 대 기 억기방법의 비교 
T-A —B+C, l-A^B+C ； B^A+C； D —D-B 


이 상에 서 고찰한 특성 들은 RISC 방식 의 잠재 적 인 우점 을 모두 결 정한다. 이 우점 들 
은 기본적으로 두 부류로 나누어 볼수 있는데 하나는 성능에 관한 우점 이고 다른 하나는 
VLSI 실현과 관련한 우점 이 다. 

성능에 대하여 먼저 고찰해 보자. 우선 보다 효과적 이며 최적화된 를파일어를 개발 
할수 있다. 명령들이 원시적일수록 고리의 밖으로 함수들을 이동하거나 효과성 있게 코 
드를 재구성할수 있으며 등록기를 최대로 리용할수 있다. 지어 번역시간에 복잡한 명령 
들의 일부를 계산하는것도 가능하다. 실례로 s /390 의 문자이동 MVC 명령은 한 위치로부 
터 다른 위치로 문자렬을 이동한다. 이 명령이 실행될 때마다 이동은 문자렬의 길이에만 
관계되며 어느 방향에서 위 치들의 겹쌓임 이 있는가 또 일치 (정 렬)특성 이 있는가에는 무 
관계하다. 대다수 경우에 이러한 내용들은 번역시간에 모두 알게 된다. 따라서 콤파일러 
는 이 기능에 대한 최적인 원시명령렬을 산생할수 있다. 

다음으로는 콤파일러에 의해 생겨 난 대다수 명령들이 상대적으로 단순하다는것 이다. 
매우 적은 마이크로코드를 리용하거나 혹은 마이크로코드를 전혀 리용하지 않는 조종장 
치는 이렇게 엄어 진 명령들을 위하여 특별히 만든것으로서 CISC 조종장치보다 이 명령 
렬을 더 빠르게 실행할수 있다. 

성 능과 관련 한 세번째 우점 은 명 령 관흐름처 리 를 리 용한다는것 이 다. RISC 연구자들은 
명 령 관흐름처 리 기 술을 축소명 령 모임 인 경 우에 훨씬 더 효과적 으로 적 용할수 있 다는것 을 
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밝히였다. 이 문제에 대하여 곧 상세히 고찰한다. 

다소 의의가 적다고 볼수 있는 마지막우점은 새치기들을 요소적인 연산들사이에서 
검사하므로 RISC 프로그람들이 새 치기에 대 한 응답성 이 더 좋다는것 이 다. 복잡한 명 령을 
가진 구성 방식 들은 명 령 한계 로 새 치 기 들을 제 한하거 나 혹은 특별 한 새 치 기 가능점 들을 정 
의하여 명 령을 재시동하는 기구를 구비해 야 한다. 

축소명 령모임구성 방식 에서 성능이 개선된 상황은 그 증명 이 힘들다. 이 에 대 한 여 러 
가지 연구들이 진행되였지만 그것은 어디까지나 비교할만한 기술과 능력을 가진 콤퓨터 
들에 서 수행 된것 들이 아니 다. 더 우기 이 대 다수 연구들은 축소명 령모임 의 영 향과 큰 등 
록기파일 의 영 향을 분리 시 켜 고찰하지 못하였 다. 

다음으로 보다 명백 한 두번째 RISC 의 우점은 VLSI 의 실현과 관련된다. VLSI 를 리 
용하는 경 우 처 리 장치 설계 와 그 실현은 근본적 으로 달라 진다. IBMS /390 과 VAX 와 같 
은 전통적 인 처 리장치들은 표준화된 SSI 와 MSI 패키지를 가지는 하나이상의 인쇄회 로판 
들로 구성된다. LSI 와 VLSI 의 출현으로 단일소편우에 하나의 처리장치를 놓을수 있게 
되였다. 단일소편처리장치에서는 RISC 전략과 관련하여 두가지 문제점들이 있다. 첫 문 
제점은 그의 성능이다. 보통 단일소편우에서의 지연은 소편들사이의 지연에 비해 훨씬 
더 작다. 따라서 한 소편으로 처 리 장치 를 실 현하면 자주 발생하는 명 령 들에 매 우 효과적 
이다. 실지로 단순명령들과 국부스칼라들에 대한 호출은 가장 많이，자주 일어 나게 된다. 
Berkeley 의 RISC 소편들은 이러한 고찰에 기초하여 설계된것들이다. 한편 전형적인 단 
일소편극소형처 리 장치들은 그의 령역의 약 절반을 마이크로코드조종기억기 로 쓰지 만 
RISC I 소편은 그의 령역의 약 8 %만을 조종장치 에 쓰고 있다 [ SHER 84]. ' 

VLSI 와 관련한 두번째 문제점은 설계와 실현시간이 다. VLSI 처리장치는 보통 개발 
하기 가 힘 들다. 설계 가들은 SSI 나 MSI 부품을 리 용하지 않고 회 로설계 와 지 면배 치，장치 
준위에서의 모형화 등을 진행해야 한다. 축소명령모임구성방식을 리용하면 이 처리를 표 
12-7 에서 보여 준바와 같이 매우 쉽 게 할수 있다 [ FITZ 81]. RISC 소편의 성능이 비 교대 
상으로 되 는 CISC 극소형처 리 장치 들의 성 능과 같게 되 면 그때 에 는 RISC 방식 의 우점 이 
명백해 진다. 


표 12-7. 일부 극소형처리장치들의 설계와 지면배치로력수 


CPU 

3 극소자 (X 1000 ) 

설계 (명-월) 

지면배치 (명-월) 

RISC I 

43 

15 

12 

risc n 

41 

18 

12 

M 68000 

68 

100 

70 

Z 8000 

18 

60 

70 

Intel iAPx -432 

110 

170 

90 


3. CISC 에 비한 RISC 의 특성 

RISC 기계들이 출현한 이후 그의 실현과 인식에서는 큰 전진이 있었다. 그 성장은 
다음파 같다. 

(1) RISC 설계는 일부 CISC 특징들을 포함하면 더 효과적 이 다. 

(2) CISC 설계 는 일부 RISC 특징들을 포함하면 더 효과적 이 다. 

이 와 같은것을 고려 하여 PowerPC 로 대 표되 는 최 신 RISC 설계 에서 는 순수 RISC 방식 을 
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더 이상 리용하지 않고 있으며 Pentium II 로 대표되는 최 신 CISC 설계 에서는 일부 RISC 
특성들을 결합시키고 있다. 

일부 연구자들이 제기한 흥미 있는 비교결과들은 이 문제에서 일정한 견해나 주견을 
가지게 한다 [ MASH 95]. 표 12-8 은 여러개의 처리장치들을 목록화하여 그것들의 여러가 
지 특성들을 비교하고 있다. 

표 12-8. 일부 처 리장치들의 특성 


처리장치 









■: M 潔 

■ 

■ 

A ] [ D 29000 



1 



4 



1 



없다 

없다 



1 



없다 



1 


8 



3 * 

MI ] S R 2000 



1 



4 



1 



없다 

없다 



1 



없다 



1 


5 



4 

은 PARC 



1 



4 



2 



없다 

없다 



1 



없다 



1 


5 



4 

N 368000 



1 



4 



3 



없다 

없다 



1 



없다 



1 


5 



4 

IPPA 



1 



4 



10 



없다 

없다 



1 



없다 



1 


5 



4 

IB ： 1 RT/PC 



2* 



4 



1 



없다 

없다 



1 



없다 



1 


4* 



3 * 

IBN RS /600 



1 



4 



4 



없다 

없다 



1 



있다 



1 


5 



5 

Ir el i 860 
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없다 

없다 



1 



없다 



1 


5 



4 

IBM 3090 

4 

8 

2 

없다 # 

있다 

2 

있다 

4 

4 

2 

Intel 80486 

12 

12 

15 


있다 

2 

있다 

4 

3 

mm 

NSC 32016 

21 

21 

23 

있다 

있다 

2 

있다 

4 

3 

3 

MC 68040 

11 

22 

44 

있다 

있다 

2 

있다 

8 

4 

3 

VAX 

56 

56 

22 

있다 

있다 

6 

있다 

24 

4 

0 

( lipper 

4* 


8* 


9* 



없다 

없다 


1 



0 



2 


4* 


3* 

Ini 나 80960 

2 * 


8 * 


9 * 



없다 

없다 


1 



있 다* 



- 


5 


3 * 


:。구 특성 에 맞지 않는 Irisc 
: 이 특성 에 맞지 않는 CISC 


표에 서 의 비 교를 위하여 다음과 같은 대 표적 인 RISC 방식 을 생 각한다. 

1) 단일명령크기 

2) 그 크기는 대 표적 으로 4 byte 이 다. 

3) 대표적으로 5 보다 작은 수의 자료주소지정 방식 . 이 파라메터는 정확히 지키기가 
힘 들다. 등록기 와 문자방식 은 표에 서 고려하지 않았으며 각이한 변위 크기 를 가진 
여러가지 형식들을 따로 계산하였다. 

4) 기 억기에서 다른 연산수의 주소를 얻기 위해 임의의 기 억기호출을 요구하는 간접 
주소지정방식은 없다. 

5) 넣기 및 기억을 산수연산과 결합하는 연산은 없다(실례로 기억기로부터의 더하기， 
기억기에 더하기). 

6) 명령당 하나이상의 기억기주소연산수는 없다. 

7) 넣 기 및 기 억연산을 위한 임의의 자료정 렬은 지 원하지 않는다. 

8) 한 명령에서는 자료주소를 위한 기억기관리단위 ( MMU ) 의 최대수리용 

9) 5혹은 그이상의 옹근수등록기지정 자를 위 한 비 트수. 이 것은 적 어도 32개의 옹근 
수등록기들을 한번에 명시적 으로 참조할수 있다는것 을 의미한다. 
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10) 4 혹은 그이상의 류점수등록기지정자의 비트수. 이것은 적 어도 16개의 류점수등 
록기들을 동시 에 명시적 으로 참조할수 있다는것 을 의미한다. 

항목 1 부터 3까지는 명령해신복잡성을 나타낸다. 항목 4부터 8 까지는 특별히 가상 
기억기요구가 있는 조건에서 관흐름처리의 용이성 혹은 곤난성을 제기하고 있다. 항목 9 
부터 10까지 는 를파일 러 를 리 용하는 능력 과 관련된다. 

표에서 첫 8 개의 처 리 장치 들은 명 확히 RISC 구성 방식의 처 리 장치 들이며 다음 4개는 
CISC 구성 방식의 처 리 장치이 고 마지 막 두개의 처 리 장치는 실지 로 CISC 의 특성 을 많이 
가지 고 있는 RISC 처 리 장치 라고 볼수 있 다. 

제5 절. RISC 의 관흐■처리 


1. 규칙명령들 가진 관흐름처리 

제 11 장 제 4 절에서 고찰한바와 같이 명령관흐름처리는 보통 성능강화에 리용된다. 
이제 RISC 구성 방식의 상황에서 이것 을 고찰해 보자. RISC 에서는 대 다수 명 령들이 등록 
기 대 등록기명 령이며 명 령주기는 다음과 같은 두 단계를 가진다. 

• I : 명령 꺼내기 

• E : 실행 . 등록기에로의 입구와 등록기로부터의 출구를 가지고 ALU 연산을 수행한다. 
넣기 및 기억연산인 경우 다음과 갈은 세가지 단계가 필요하다. 

• I : 명령 꺼내기 

• E : 실행 . 기 억 기 주소계 산 

• D : 기억.등록기 대 기억기 혹은 기억기 대 등록기연산 

그림 12-6 자 는 관흐름처 리 를 리 용하지 않는 명 령렬의 사간관계 를 보여 주고 있다. 
이것은 명백히 쓸모 없는 처리라는것을 알수 있다. 매우 다양한 관흐름처리라고 해도 성 
능을 어느 정도밖에 개선할수 없다. 그림 12-6 느는 두방향관흐름처 리 방식을 보여 주고 
있다. 두방향관흐름처리에서는 두개의 서로 다른 명령들이 I 및 E 단계에서 동시에 수행 
된다. 이 방식 은 관흐름처 리 를 진행하지 않은 방식 즉 직 렬 방식 의 실행속도보다 2 배의 
속도상승을 가져 올수 있 다. 그러 나 다음과 갈은 두가지 리유로 최 대 속도상승을 달성하 
기 힘들다. 그것은 첫째로, 단일포구기억기를 리용하며 단계마다 하나의 기억기호출만이 
가능하다고 가정하였기때 문이 다. 이것은 일부 명 령 들에서 대 기 상태를 삽입할것을 요구한 
다. 두번째 리 유는 분기 명 령 들이 련속실 행 흐름을 중단하기 때 문이 다. 최 소순환성 을 가지 고 
이것을 순응시키기 위하여 NOOP 명령이 콤파일러 혹은 아쌤블러에 의한 명령흐름에 삽 

관흐름처 리 는 한 단계당 두개 의 기 억 기호출이 가능하면 그 성 능을 더 욱 개 선 할수 
있다. 이 원리에 기초하여 얻어 진 명령렬을 그림 12-6 도에 보여 주고 있다. 여기서는 3 
개의 명령을 중복시켜 그 성능을 3 배로 높이고 있다. 또한 분기명령들은 그 최대값까지 
속도상승을 떨구지 않지 만 떨 구는것 만은 사실 이 다. 뿐만아니 라 자료의 상관성 (의 존성 )도 
속도상승에 영향을 준다. 만일 한 명령이 실행명령에 의해 교체되는 연산수를 요구한다 
면 지연이 생긴다. 이 지연은 NOOP 명령에 의해 맞출수 있다. 

이제까지 론의한 관흐름처리는 3 개의 단계가 근사적으로 갈은 존속시간에 있는 경 
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우에 가장 효과적 이 다. 그림 12-6 에 서 E 단계 는 보통 ALU 연산을 동반하므로 다른 단계 
보다 더 시간이 오래 걸린다. 이 경우에는 이 단계를 다음과 같은 두개의 부분단계로 분 
할할수 있다. 

• E 1： 등록기 파일읽 기 

• E 2： ALU 연산과 등록기 쓰기 

명 령모임 이 단순하고 규칙 적이므로 3 혹은 4 개의 단계 로 맞추는 설계 를 쉽 게 할수 
있 다. 그림 12-6 근 는 네방향관흐름의 결 과를 보여 주고 있 다. 이 관흐름에 서 는 단번 에 4 
개의 명 령까지 처 리할수 있으며 최대로 가능한 속도상승은 직렬방식 에 비해 4 배로 된다. 
여 기서도 자료의 의존성 및 분기명 령을 고려한 NOOP 명 령의 리용이 지연을 발생시킨다 
는것을 다시금 강조한다. 


넣기 A — M 

田 I 回 

넣기 A ᅳ M 

[IE 回 

넣기 B — M 

d 瓦回 

넣기 B ᅳ M 
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b [nn 

더 하기 C ^ 一 A 사 

-B 因 固 
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1 1 Ir 1 
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H B mu 
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기억 M ^ — C 

1 I lE.hjD 

분기 X 

mm 

분기 x 

FEIeI 


r 「 瓦瓦 n 
|i Ir.IrJ 


그림 12-6. 관흐름조종의 효과 

- 순차실행, L - 2 단관흐름동기, C -3 단관흐름동기, ᄅ- 4 단관흐름동기 


2. 관흐름처리의 최적화 

RISC 명령은 단순하면서도 규칙적인 명령이므로 여기에 관흐름처리방식을 효과적으 
로 적용할수 있다. 보통 명령이 실행되는 동안에 얼마 안되는 변동이 있을수 있으나 이 
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것을 반영하여 관흐름이 재구성된다. 그러나 자료 및 분기의 의존성 혹은 상관성으로 인 
하여 총체적 인 실행속도는 감소하게 된다. 

이 의존성에 대한 보상으로서 코드재구성기술이 개발되여 리용되고 있다. 이것을 보 
기 위하여 우선 분기처리명령을 고찰해 보자. 관흐름의 효과성을 증가시키는 한가지 방 
법인 지연분기는 분기명령에 뒤따르는 명령이 실행된후에야 분기명령을 실행하게 한다. 
분기명령에서 분기를 즉시 뒤따르는 명령위치까지를 지연름이라고 한다. 이 이상한 름을 
표 12-9 에 서 설 명 하였 다. 《 정 상분기》라는 표식 이 붙은 렬 에 있는것 은 정 상기 호명 령 기 
계 어프로그람이다. 이 틀에서 보면 102가 실행된후에 실행되 여 야 할 다음명 령은 105이 다. 
관흐름을 규칙화하기 위하여 이 분기명 령 다음에 NOOP 명 령을 삽입한다. 이것 이 지연분 
기이다. 그러나 성능증가는 101 과 102 의 명령들을 서로 바끌 때 일어 난다. 그림 12-7 
은 이 결과를 보여 주고 있다. 


표 12-9. 정상 및 지연분기 


주 소 

정상분기 

지연 분기 

최적지 연분 기 

100 

LOAD 

X,A 

LOAD 

X,A 

LOAD 

X,A 

101 

ADD 

l’A 

ADD 

1,A 

JUMP 

105 

102 

JUMP 

105 

JUMP 

106 

ADD 

l’A 

103 

ADD 

A,B 

NOOP 


ADD 

A,B 

104 

SUB 

C,B 

ADD 

A,B 

ADD 

A,B 

105 

STORE 

A,Z 

SUB 

C,B 

STORE 

A,Z 

106 



STORE 

A, Z 




100 X ， A 를 넣기 |T|r |~p] 

101 I， A 를 더 하기 | I | F- 1 

102 106 문 뛰 여 넘기 | I | F. | 

103 LOOP | I |F. I 

106 A,Z 를 기 억 Q l F l D I 


100X，A 를 넣기 I I |F- I D I 

101 105 로 뛰 여 넘 기 I I I F. j 

102 I， A 더 하기 ■ 1 h 니 

105 A,Z 를 기억 I 1 |P- l D I 

i.) 

그림 12-7. 지연분기의 리용 
*1 - 삽입된 명령， 예약된 명령 


그림 에 서 보면 JUMP 명 령 을 ADD 명 령 
보다 먼저 불러 낸다. 그러나 명심해야 할 
것은 JUMP 명 령의 실행 으로 프로그람계수 
기의 내용이 교체되기전에 ADD 명령을 
불러 낸다는것이다. 결국 프로그람의 원래 
의미는 보존된다. 

이러한 명령의 교체는 무조건분기, 호출 
과 복귀 등에 서 성 과적 으로 리용할수 있 
다. 조건분기인 경우에는 이러한 틀이 맹 
목적 으로 적 용되 지 않는다. 분기 를 위해 
검사되는 조건이 선행명령으로 즉시 바꾸 
어 지는 경우에는 콤파일러가 교체를 그 
만 두어 야 하며 대 신 NOOP 를 삽입해 야 
한다. 이 와 반대 인 경 우에 는 를파일 러 가 분 
기명 령 다음에 목적하는 명 령을 삽입할수 
있다. Berkeley RISC 와 IBM 801 체계에 
서의 경험은 대다수 조건분기명령들을 이 
와 같은 형식으로 최적화할수 있다는것을 
보여 주고 있다 ([ PATT 82 a ]，[ RADI 83]). 

이와 류사한 지연넣기 라고 하는 방법을 
LOAD 명 령 에도 리 용할수 있다. LOAD 명 
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령에서 넣기목표로 되는 등록기는 처리장치에 의해 밀폐되여 있다. 처리장치는 이 등록 
기를 요구하는 명령을 만날 때까지 명령흐름의 실행을 계속하며 넣기가 없는 한 이 등록 
기는 놀고 있다. 콤파일러가 넣기명령의 관흐름에 있는 경우 쓸모 있는 작업을 수행하도 
록 명령을 재배치할수 있는 능력을 가지면 효과성이 증가된다. 

마지막으로 강조하고 싶은것은 명령관흐름설계를 그 체계에 적용되는 다른 최적화기 
술과 분리시켜 별도로 하지 말아야 한다는것이다. 실례로 관흐름의 명령실행일정맞추기 
와 동적 인 등록기 할당은 가장 큰 효과성을 엄을수 있도록 명 령관흐름설계와 함께 고찰해 
야 한다 [ BRAD 91 b ]. 


제6 절. MIPS R 4000 

처 음으로 상품화되 여 리 용한 처 리 장치 소편들중에 는 MIPS 기 술회 사가 개 발한것 도 있 
다. 이 절에서는 MIPS R 4000 에 대 하여 고찰한다. MIPS R 4000 은 실제상 이전의 MIPS 
설계 ( R 2000， R 3000 과 R 6000 설계) 와 같은 구성방식, 같은 명령모임을 가진다. 가장 중요 
한 차이는 R 4000 이 모든 내부 및 외부자료경로，주소지정，등록기 그리고 ALU 에 대 하 
여 32 bit 가 아니 라 64 bit 를 리 용한다는것 이 다. 

64 bit 를 리 용하면 32 bit 구성 방식 에 비 해 여 러 가지 우점 이 있 다. 즉 조작체 계 에 충분 
히 큰 주소공간을 할당하므로 가상기억기에 직접 Tbyte 이상의 파일을 배치할수 있으며 
따라서 기억기호출이 쉽다. 오늘날 일반적으로 리용되고 있는 1 Gbyte 이상의 디스크구 
동기를 가지게 되면 32 bit 콤퓨터인 경우 4 Gbyte 주소공간이 극한값으로 된다. 또한 
64 bit 용량은 R 4000 이 IEEE 의 단정 확도류점수와 같은 자료나 한번의 동작에서 8 개 문 
자까지 의 문자렬 자료를 처 리할수 있게 한다. 

R 4000 처 리 장치 소편은 두개 의 부분으로 나누어 져 있 다. 하나는 CPU 이 며 다른 하나 
는 기 억 기 관리 를 위한 협 동처 리 장치이 다. 이 처 리 장치 는 매 우 단순한 구성 방식 으로 되 여 
있다. 처리장치의 목적은 성능을 강화하는 론리를 리용할수 있는 공간(실례로 완전한 기 
억기관리단위)을 조성 하면서 명 령실행론리 가 단순한 체 계를 설계하는것이 였다. 

처 리 장치 는 32개의 64 bit 등록기를 가지 고 있다. 또한 128 Kbyte 까지의 높은 속도 캐 
쉬를 장비하며 이 128 kbyte 의 용량은 명령과 자료에 각각 절반씩 배당된다. 상대적으로 
큰 캐쉬 (IBM 3090 은 128〜 256 Kbyte 의 캐 쉬를 구비 하고 있다.)는 주기 억 기 모선에 넣지 
않거 나 창문론리 를 가진 큰 등록기파일 을 요구하지 않고도 처 리 장치 에 국부적 으로 큰 묶 
음의 프로그람 코드와 자료를 유지할수 있게 한다. 

1. 명령모임 

표 12-10 에 는 모든 MIPS 계 렬처 리 장치들의 기 본명 령모임 을 보여 주었다. 또한 표 
12-11 에는 R 4000 에서 실현된 추가적인 명령들을 보여 주었다. 모든 처리장치의 명령들 
은 단일 한 32 bit 단어 형 식 으로 부호화된다. 모든 자료연산은 등록기 대 등록기연산이 며 
기 억기 참조만이 순수한 넣기 및 기 억연산들이다. 

R 4000 에서는 조건코드를 리용하지 않는다. 어떤 명령이 조건을 발생하면 그에 대응하는 
기 발들이 일반등록기 에 기 억된다. 이 렇게 하면 조건코드들이 관흐름처 리 장치구와 콤파일 러 에 
의한 명령의 재순서화에 영향을 주므로 조건코드를 처리하는 특별한 론리가 필요 없다. 그대 
신 관흐름처리장치구가 등록기값의 의존성을 처리할수 있어야 한다. 더우기 등록기파일에 배 
치된 조건들은 번역시간내에 할당되여 등록기에 기억된 다른 값들로서 재리용한다. 
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op 


op 


설명 


설명 



넣기 및 기억명령 


곱하기 및 나누기명령 

LB 

바이트넣기 

MULT 

곱하기 

LBU 

부호 없는 바이트넣기 

MULTU 

부호 없는 곱하기 

LH 

반단어 넣기 

DIV 

나누기 

LHU 

부호 없는 반단어넣기 

DIVU 

부호 없는 나누기 

LW 

단어 넣기 

MFHI 

HI 로부터 이 동 

LWL 

왼쪽 단어넣기 

MTHI 

HI 에로 이동 

LWR 

오른쪽 단어넣기 

MFLO 

LO 로부터 이 동 

SB 

바이트기억 

MTLO 

LO 에로 이동 

SH 

빈단어 기억 


뛰여넘기와 분기명령 

SW 

단어 기억 

J 

JAL 

뛰 여 넘기 

SWL 

왼쪽 단어기억 

뛰여넘기와 련결 

SWR 

으른쪽 단어기억 

JR 

등록기 에 로 뛰 여넘기 


산수연산명 령 (ALU 직 접 값) 

JALR 

뛰 여넘기와 련결등록기 

ADDI 

직접값더하기 

BEQ 

갈은 경우 분기 

ADDIU 

부호 없는 직접값더하기 

BNE 

갈지 않은 경우 분기 

SLTI 

직접값보다 작은 경우에 설정 

BLEZ 

작거나 령과 같은 경우 분기 

SLTIU 

부호 없는 직접값보다 작은 
경우에 설정 

BGTZ 

령보다 큰 경우 분기 

ANDI 

직접값론리곱하기 

BLTZ 

령보다 작은 경우 분기 

ORI 

직접값론리더하기 

BGTZ 

령보다 큰 경우 분기 

XORI 

직접값안맞음론리더하기 

BLTZAL 

령보다 작거 나 련결인 경우 분기 

LUI 

웃직접값전개 

BGEZAL 

령보다 크거 나 같고 련결인 
경우 분기 

산수연산명 령 (3 -연산수, R - 형 ) 


협동처리장치명령 

ADD 

더 하기 

LWC Z 

협동처리장치에 단어넣기 

ADDU 

부호 없는 더하기 

SWC Z 

협동처리장치에 단어기억 

SUB 

덜기 

MTC Z 

협동처리장치에 이동 

SUBL 

부호 없는 덜기 

MFC Z 

협동처리장치에서 이동 

SLT 

보다 작으면 설정 

CTC Z 

협동처리장치에 조종을 이동 

SLTU 

부호 없는 수보다 작으면 설정 

CFC Z 

협동처리장치에서 조종을 이동 

AND 

론리 곱하기 

COP z 

협동처리장치연산 

OR 

론리 더하기 

BC Z T 

고가 참이면 협동처리장치로 분기 

XOR 

안맞음론리더하기 

BC Z F 

고가 거짓이면 협동처리장치로 분기 

NOR 

더하기 부정 


특수명령 


밀기 명령 

SYSCALL 

체 계 호출 

SLL 

론리왼쪽밀기 

BREAK 

중지 

SRL 

론리오른쪽밀기 



SRA 

산수오른쪽밀기 



SLLV 

론리변수왼쪽밀기 



SRLV 

론리변수오른쪽밀기 



SRAV 

산수변수오른쪽밀기 








표 12-11. 추가적 인 R 4000 명 령 


Op 

설명 

Op 

설명 


넣기 및 기억명령 


례외명령 

LL 

련결 넣기 

TGE 

보다 크거나 갈으면 추적 

SC 

조건기억 

TGEU 

부호고려가 없이 보다 크거나 같 
으면 추적 

SYNC 

동기 

TLT 

보다 작으면 추적 


뛰여넘기와 분기명령 

TLTU 

부호고려가 없이 보다 작으면 추적 

BEQL 

갈으면 분기 

TEQ 

갈으면 추적 

BNEL 

같지 않으면 분기 

TNE 

같지 않으면 추적 

BLEZL 

보다 작거나 령과 같으면 분기 

TGEI 

직접값보다 크거 나 갈으면 추적 

BGTZL 

령보다 크면 분기 

TGEIU 

부호 없는 직접값보다 크거나 같으 
면 추적 

BGEZL 

령보다 작으면 분기 

TLTI 

직접값보다 작으면 추적 

BLTZALL 

령보다 작거나 련결이면 분기 

TLTIU 

부호 없는 직접값보다 작으면 추적 

BGEZALL 

보다 크고 령과 같거나 련결 
이면 분기 

TEQI 

직접값과 갈으면 추적 

BC Z TL 

Z 가 참이 면 협 동처 리 장치 로 분기 

TNEI 

직접값과 같지 않으면 추적 

CD Z FL 

Z 가 거짓이면 협동처리장치로 
분기 


협동처리장치명령 


LDC Z 

2 중협동처리장치넣기 



SDC Z 

2 중협동처리장치기억 


대 다수 RISC 에 기초한 를퓨터들과 마찬가지 로 MIPS 는 단일한 32 bit 명 령길 이를 가 
진다. 이 단일한 명 령길이는 명 령꺼내기와 해신을 쉽게 하며 또 가상기 억기관리단위 (명 
령들이 단어 혹은 폐지경계를 가로지르지 않는다.)와 명령꺼내기의 호상작용을 간단하게 
한다. 세가지 명령형식(그림 12-8) 은 명령해신을 간단히 할수 있도록 조작코드와 등록기 
참조에서 공통적인 형식화를 가진다. 더 복잡한 명령들의 형식은 번역할 때 분석한다. 


6_ 5 5. _16 



rs - 원천등록기지정자 
rt - 원천/목적등록기지정 자 
rd - 목적등록기지정자 
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그림 12-8. MIPS 의 명 령형식 







MIPS 에서는 가장 단순하면서도 가장 빈번히 리용되는 기억기주소지정방식만이 하 
드웨 어 로 실 현된 다. 모든 기 억 기 참조는 32 bit 등록기 로부터 의 16 bit 변위 로 이 루어 진다. 
실 례 로 단어 넣기 명 령은 다음과 갈은 양식 을 가진다. 

lw r 2，128( r 3) : 등록기 3 으로부터 변위된 주소 128 에 있는 단어를 등록기 2 에 넣는다. 

모든 32 bit 일 반등록기 들은 기 준등록기 로 리 용할수 있 다. 등록기 rO 은 늘 0 을 가진다. 

콤파일 러 는 일 반콤퓨터 들에 서 의 전형 적 인 주소지 정 방식 들을 합성 하는 여 러 기 계 명 령 
들을 리용할수 있게 한다. 이 와 관련한 몇 가지 실례 를 표 12-12 에 보여 주었 다 
[ CHOW 87]. 이 표는 lui (웃직접값넣기)명령의 리용을 보여 주고 있다. 이 명령은 16 bit 
직 접 값을 등록기 의 웃절 반에 넣 고 아래 절 반은 0 으로 설정 한다. 


표 12-12. 다른 주소지 정 방식 들을 MIPS 주소지 정 방식 과 합성하기 




표면상 

명 령 


실지 명령 

Lw 

r 2, 

< 16 bit 의 

변위 > 

lw r 2, 

< 1 的 it 의 변위〉 ( rO ) 

Lw 

r 2, 

< 32 bit 의 

변위 > 

lui rl , 
lw r 2, 

<높은 1的 it 의 변위 > 

〈낮은 1的比의 변위 > ( rl ) 

lw 

r 2, 

< 32 b 比의 

변위 > ( r 4) 

lui rl , 〈높은 16 bit 의 변위〉 
addu rl , rl , r 4 





lw r 2, 

< 낮은 16 bit 의 변위 >( rl ) 


2. 명령관흐를 

MIPS 명령구성방식이 단순하므로 MIPS 는 매우 효과적인 관흐름처리를 할수 있다. 
MIPS 관흐름의 발전과정 을 고찰하는것 은 일 반적 인 RISC 관흐름처 리 의 발전을 설 명하는 
것이므로 이것을 고찰해 보자. 

초기의 실험 적 인 RISC 체계 와 첫 세 대의 상품화된 RISC 처 리 장치들은 체계박자주기 
마다 하나의 명 령을 처 리하는 실행속도를 가지고 있다. 이 속도를 개선하기 위하여 두가 
지 종류의 처 리 장치 들 즉 슈퍼스칼라구성 방식 과 슈퍼관흐름구성 방식 에 기 초한 처 리 장치 
들이 개 발되 였다. 이 처 리 장치들은 체계박자주기당 여 러개의 명 령을 실행할수 있다. 본질 
적으로 슈퍼스칼라구성방식은 관흐름의 한 단계에서 두개이상의 명령들이 동시에 처리될 
수 있도록 매 관흐름단계들을 재현시 킨다. 슈퍼관흐름구성 방식은 보다 조밀하게 세분화 
된 관흐름단계 를 리용할수 있게 하는 구성 방식이 다. 단계 가 많을수록 더 많은 명 령 들이 
갈은 시간에 관흐름에 있을수 있으며 이것은 병렬처리화를 증가시키는것으로 된다. 

이상의 두가지 방식들은 각기 제한성을 가지고 있다. 우선 슈퍼스칼라관흐름처 리에 
서는 각이한 관흐름들에서 명 령들사이 의존성 이 체 계의 속도를 떨굴수 있다. 또한 간접 
소비시간론리가 이 의존성을 맞추기 위하여 필요하다. 슈퍼관흐름처리된 처리인 경우에 
는 한 단계에서 다음단계로 명 령들을 전송하는것과 관련한 간접소비시간이 있다. 

슈퍼 스칼라구성 방식 에 대 한 고찰은 제 13 장에 서 진행 한다. MIPS R 4000 은 RISC 에 
기초한 슈퍼관흐름구성 방식의 대표적 인 실례 이 다. 

그림 12-9 1는 R 3000 의 명 령 관흐름을 보여 주고 있다. R 3000 에서는 관흐름이 박자 
주기당 한번 전진한다. MIPS 콤파일 러 는 지 연름의 70〜90%를 코드로 채 우도록 명 령 들을 
재정돈한다. 모든 명 령들은 다음과 갈은 5개의 관흐름단계를 차례 로 거친다. 


• 명령꺼내기 
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• 등록기 파일 로부터 원 천 연산수꺼 내 기 

• ALU 연산 혹은 자료연산수주소발생 

• 자료기억기참조 

• 등록기파일 에 거 꾸로 쓰기 


그림 12-9 가에서 설명하고 있는바와 같이 관흐름처리에는 관흐름처리로 인한 병렬 
화만이 아니라 단일한 명령실행에서의 병렬화도 있다. 이를 위하여 60 ns 의 박자주기를 
두개의 30 ns 주기 단계로 분할한다. 외부명 령과 캐쉬 에 대 한 자료호출연산들은 주요 내부 
연산들 ( OP ， DA ， IA ) 과 같이 모두 60 ns 를 요구한다. 명 령해신은 하나의 30 ns 주기 단계 
만을 요구하는 단순한 연산으로서 매 명령에서 등록기꺼내기와 겹쳐 진다. 분기명령인 
경우 주소계산에서도 역시 명령해신과 등록기꺼내기가 겹쳐 져 명령 i 에서의 분기가 명 
령 i + 2 의 명 령캐쉬 ( ICACHE ) 호출을 지정 할수 있다. 이와 류사하게 명 령 군에서의 넣기 
는 명령 i +1 의 연산수로 직접 리용되는 자료를 불러 낸다. 한편 ALU 및 밀기결과는 지 
연이 없이 명령 i + 1 로 직접 넘어 간다. 이와 같이 명령들사이를 긴밀하게 결합시키면 
매우 효과적 인 관흐름을 만들수 있다. 


-0 


주기 

| 예 | 해 | 

주기 | 

주기 | 주기 \ 

| ITLB 

| I-CachJ RF | ALU 

| DTLB | l>Cach | wb | 


니 



| 주기 

| 해 | 하 1 | 

주기 | 

주기 | 

| ITLB 

| RF | ALU | D - Cach | TC 

l WB l 


if - 명령 꺼내기 

RD - 읽기 

MEM - 기 억 기 호출 

WB - 뒤로 쓰기 

I-Cache - 명령캐쉬호출 
RF - 등록기로부터 연산수꺼내기 

D-Cache - 자료캐쉬호출 
ITLB - 명령주소변환 
IDEC - 명 령 해 신 

IA - 명 령 주소계 산 

DA - 자료가상주소계 산 

DTLB - 자료주소변환 


TC - 자료캐쉬꼬리표검사 


n) 


그림 12-9. R 3000 관흐름의 강화 

"1- 구체화된 R 3000 관흐름, L - 단축된 대기시간을 가진 축소 R 3000 관흐름， 
병 렬 TLB 캐 쉬 호출이 있는 최 적 R 3000 관흐름 


구체적으로는 매 박자주기 가 그림에서 $1 및 $2 로 표시 한 개 별적 인 30 ns 주기 단계 
들로 분할된 다. 이 매 주기단계 에 서 수행 되 는 기 능들은 표 12-13 과 갈다. 

R 4000 은 R 3000 에 비 해 여 러 가지 기술적 인 발전을 가져 왔다. 보다 고급한 기술을 
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리용하면 체계박자주기시간을 절반으로 즉 30 ns 로 줄일수 있으며 등록기파일에 대한 호 
출시간도 절반으로 단축할수 있다. 이외에도 소편의 더 큰 고밀도화를 실현하면 명령과 
자료캐쉬들을 한 소편우에 실현할수 있다. R 4000 의 관흐름을 고찰하기전에 마지막으로 
R 3000 관흐름을 성 능이 개선되도록 수정 하여 R 4000 기술로 어떻 게 리 용하는가를 보기로 
하자. 

그림 12-9 i •는 관흐름의 첫 단계를 보여 주고 있다. 우선 이 그림에서 주기는 그림 
12-9 n 에서의 주기보다 절반 작다는것을 보여 준다. 명령 및 자료캐쉬가 한 소편내에 있 
으므로 명령 및 자료캐쉬단계들은 길어서 절반시간 (30 ns ) 을 가진다. 총체적으로 이 단계 
들은 한 박자주기만을 차지한다. 또한 등록기파일의 속도상승으로 등록기읽기와 쓰기 역 
시 한 박자주기의 절반시간을 차지한다. 


표 12-13. R 3000 의 관흐름단계 


관흐름단계 

주기 단게 

기 능 

IF 

少 1 

TLB 를 리용하여 명 령의 가상주소를 물리주소로 번역한다 
(분기판정 을 한후) 

IF 

< E >2 

물리주소를 명 령주소로 보낸다. 

RD 

少1 

명령캐쉬로부터 명령을 복귀 
꼬리표들과 불러 낸 명령의 유효성을 비교 

RD 

少2 

명령해신, 등록기파일읽기 
분기인 경우 분기목표주소계산 

ALU 

少 1+少2 

를록기 대 등록기연산이면 산수 혹은 론리연산을 수행 

ALU 

少 1 

분기인 경우 그것이 일어 나는가 일어 나지 않는가를 
판정，기억기참조(넣기 혹은 기억)인 경우 자료가상주소계산 

ALU 

< E 〉2 

기 억 기참조인 경 우 자료가상주소를 TLB 를 리 용하여 
물리주소로 번역 

MEM 

少1 

기 억기참조인 경 우 자료캐쉬 에 물리주소보내 기 

MEM 

少2 

기 억 기참조인 경 우 자료캐 쉬 로부터 자료를 복귀 하고 
꼬리표를 검사 

WB 

<1>1 

봉록기파일에 쓰기 


R 4000 캐쉬들이 한 소편우에 있으므로 가상주소 대 물리주소번역은 캐쉬호출을 지 연 
시킬수 있다. 이 지연은 캐쉬를 가상적으로 첨수화된것으로 실현하거나 캐쉬호출과 주소 
번역을 병렬로 진행하면 감소시킬수 있다. 그림 12-9 도는 이와 같은 방법을 적용한 최적 
R 3000 관흐름을 보여 주고 있다. 사건들이 압축되여 있으므로 자료캐쉬꼬리표검사는 캐 
쉬호출후의 다음주기 에 서 따로따로 수행 된 다. 

슈퍼관흐름체계 에서는 관흐름등록기 들을 모든 관흐름단계 를 분할하도록 삽입하여 하 
드웨어 로 박자주기당 수배 의 리 득을 실현하고 있 다. 본질 적 으로 모든 슈퍼 관흐름단계 는 기 
본박자주파수의 배 수로 동작한다. 이 배 수는 슈퍼 관흐름처 리 의 등급에 관계 된 다. R 4000 기 
술은 등급 2 의 슈퍼관흐름처리를 보장하는 속도와 밀도를 가진다. 그림 12-10 자는 이 슈퍼 
관흐름처 리를 리용하는 최적화된 R 3000 관흐름을 보여 주고 있다. 이 그림은 본질적 으로는 
그림 12-9 도와 같은 동적구조이다. 이렇게 하면 성능을 보다 더 개선할수 있다. 

R 4000 에서는 이 보다 훨씬 더 크고 전용화된 가산기를 설계한다. 이 가산기 는 ALU 
연산을 2배의 속도로 실행할수 있다. 이 밖에 넣기 및 기 억연산의 속도도 2배로 높일수 
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있게 성능을 개선하였다. 이와 갈은 결과를 가져오는 관흐름을 그림 12-10 l 에 보여 주 
었 다. 


박자주기 


IC1 1 IC2 

02 

RF ALU 

ALU DC1 

DC2 TCI 

TC2 WB 1 

1 IC1 

IC2 RF 

ALU ALU 

DC1 DC2 

TCI TC2 1 ALU | 


박자주기 


Ol 02 

IF | IS 

3)1 02 

RF EX 

Ol 02 

DF DS 

Ol 02 

TC WB 


L 노 

IS RF 

EX DF 

DS DS 

WB | 


니 


IF = 전반명 령꺼 내 기 IS = 후반명 령꺼 내 기 RF = 등록기 로부터 조작코드꺼 내 기 

EX = 명 령 실 행 1 C = 명 령 케 쉬 DC = 자료캐 쉬 

DF = 전반자료케 쉬 DS = 후반자료캐쉬 TC = 표식 자검 사 


그림 12-10. 리 론적 인 R 3000 과 실지 R 4000 의 슈퍼 관흐름 
1- 최 적 R 3000 관흐름의 슈퍼관흐름조종실 현 , L - R 4000 의 관흐름 

R 4000 은 8 개 의 관흐름단계 를 가지 는에 이 것 은 8 개 의 명 령 이 같은 시 간에 관흐름에 
있을수 있다는것을 의미한다. 관흐름은 박자주기당 두 단계의 속도로 전진한다. 이 8 개 
의 관흐름단계들은 다음과 같다. 

• 전 반명 령 꺼 내 기 : 가상주소를 명 령 캐 쉬 와 변환엿 보기 완충기 ( TLB ) 에 넣 는다. 

• 후반명령꺼 내기 : 명 령캐쉬가 명 령을 출구하고 TLB 가 물리주소를 발생한다. 

• 등록기파일 : 세가지 동작이 병렬로 일어 난다. 

• 명령을 해신하여 련쇄조건들을 검사한다(이 명령은 앞선 명령의 결과에 의존한다.). 

• 명령캐쉬꼬러부검사가 진행된다. 

• 연산수들을 등록기파일 로부터 불러 낸 다. 

• 명령실행 : 세가지 동작중 어느 하나가 일어 날수 있다. 

•명령이 등록기 대 등록기 연산인 경우 ALU 는 산수 혹은 론리 연산을 수행 한다. 

• 명령이 넣기 혹은 기억 명령이 면 자료가상주소를 계 산한다. 

• 명령이 분기명령이면 분기목표의 가상주소를 계산하고 분기조건을 검사한다. 

• 전반자료캐 쉬 : 가상주소를 자료캐 쉬 와 TLB 에 넣 는다. 

• 후반자료캐쉬 : 자료캐쉬 가 명 령을 출구하고 TLB 가 물리주소를 발생한다. 

• 꼬리부검사 : 넣기 및 기억명령에 대하여 캐쉬꼬리부검사를 수행한다. 

• 거꾸로 쓰기 : 명 령의 결과를 등록기파일에 쓴다. 
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제 7 절. SPARC 


SPARC (Scalable Processor ARChitecture ) 는 Sun Microsystems 에 의 해 정의된 
구성 방식이 다. Sun 은 그 자신이 SPARC 를 개 발하고 실현시 켰을뿐아니 라 SPARC 와 호 
환성 이 있는 콤퓨터 구성 방식들을 다른 를퓨터 장치 및 프로그람관련회 사들이 개 발하도록 
허용하고 있다. SPARC 구성방식은 Berkeley 의 RISC I 기계에 그 뿌리를 두고 있으며 
그의 명 령 모임 과 등록기 구성 은 Berkeley 의 RISC 모형 에 기 초하고 있 다. 

1. SPARC 의 등록기묶음 

Berkeley 의 RISC 와 마찬가지 로 SPARC 는 등록기 창문을 리 용한다. 매 창문은 24 
개의 등록기로 구성되며 창문의 총수는 SPARC 의 실현에 따라 결정되는데 대체로 2〜 
32개의 범위에 있다. 


들리 등록기 틀 A 



7 R7 R7 R7 

Globals Globals Globals Globals 

o_ ro_ ro ro_ 


그림 12-11. 3 개의 틀을 가전 SPARC 등록기창문의 지면배 치 


415 




그림 12-11 은 총 136 개의 물리등록기들을 리용하여 8 개의 창문으로 실현한 등록기구성 
을 보여 주고 있다. 이미 이 장의 제 1 절에서 고찰한것처럼 이 수는 등록기창문구성에서 
합리 적 인 수로 된다. 물리 등록기 0부터 7은 모든 틀들에 서 공유하는 전역 등록기 이다. 
모든 처 리는 론리등록기 0부터 31을 참조한다. 그림 12-11 에서 《 입 구》로 표시된 론리 
등록기 24로부터 31은 호출하는 틀(어미)에서 공유하며 《출구》라는 표식이 불은 론리 
등록기 8부터 15는 호출된 틀(아들)에서 공유한다. 이 두 부분들은 다른 창문들과 겹치 
게 된다. 그림 에서 《국부》라는 표식 이 불은 론리 등록기 16 으로부터 23 은 공동으로 리 
용되지 않으며 다른 창문들과 겹 치지 않는다. 다음으로 이미 제 4 장 제 1절에서 고찰한바 
와 같이 파라메터넘 기기를 위해 8 개의 등록기를 리용하면 대부분의 경우에 알맞는것으 
로 된다(실례로 표 12-4 참고). 

그림 12-12 는 등록기겹 침의 다른 한가지 고찰방법 을 보여 주고 있다. 호출하는 틀은 
임의의 파라메터 들을 그의《출구》등록기들에 넘기도록 배 치한다. 그리 고 호출된 틀은 이 
등록기 들을 그의 《 입 구》등록기 들로서 취 급한다. 처 리 장치 는 처 리 장치 상태 등록기 ( PSR ) 
에 위 치 한 현재 창문지 시 기 ( CWP ) 를 보존한다. 여 기서 처 리 장치 상태 등록기 는 현재 실행 
중인 틀의 창문을 가리킨다. 처 리 장치상태 등록기 내의 창문무효마스크 ( WIM ) 역시 어느 창 
문이 무효인가를 지 적한다. 


CWP 
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그림 12-12. SPARC 에서 원형탄창을 이루는 8 개의 등록기창문 



SPARC 등록기구성방식에서는 자료나 명령을 틀호출을 위해 등록기들에 보관 및 회 
복시키지 말아야 한다. 그것은 를파일러가 효과적 인 방법으로 틀에 국부등록기들을 할당 
할뿐 틀들사이 등록기할당에는 무관하게 동작하도록 단순화되 였기때 문이 다. 

2. 명령모임 


표 12-14 는 SPARC 구성 방식에서 의 명 령들을 보여 주고 있다. 대 다수의 명 령 들은 
오직 등록기연산수만을 참조한다. 등록기 대 등록기명령들은 3 개의 연산수를 가지며 다 
음과 같은 양식으로 표시된다. 


R,j R s i op S 2 

여 기서 R d 와 R sl 은 등록기 참조이며 S 2 는 하나의 등록기 혹은 13 bit 의 직접값연산수가 
될수 있다. 등록기 R 0 은 값 0 으로 고정되여 있다. 우의 이 양식은 국부스칼라변수와 상 
수들이 대부분 프로그람들에 아주 잘 맞는다. 


표 12-14. SPARC 의 명령모임 


연산 

해 

에 

설명 

넣기/기억 명령 

산수연산명령 

LDSB 

부호 있는 바이트넣기 

ADD 

더 하기 

LDSH 

부호 있는 반단어넣기 

ADDCC 

더하기 set , icc 

LDUB 

부호 없는 바이트넣기 

ADDX 

자리올림이 있는 더하기 

LDUH 

부호 없는 반단어넣기 

ADDXCC 

자리올림이 있는 더하기 
set , icc 

LD 

단어 넣기 

SUB 

덜 기 

LDD 

배 단어 넣 기 

SUBCC 

덜기 set , icc 

STB 

바이트기억 

SUBX 

자리내림이 있는 덜기 

STH 

반단어 기억 

SUBXCC 

자리내림이 있는 덜기 set , 
icc 

STD 

단어 기억 

MULSCC 

다중계 단 set , icc 

STDD 

배 단어 기 억 

뛰여넘기/분기 명령 

밀기명령 I 

BCC 

조건분기 

SLL 

왼쪽 론리밀기 

FBCC 

류점수조건분기 

SRL 

오른쪽 론리밀기 

CBCC 

협동처리장치조건분기 

SRA 

오른쪽 산수밀기 

CALL 

틀호출 

론리연산명령 

JMPL 

뛰여넘기와 련결 

AND 

론리 곱하기 

TCC 

조건추적 

ANDCC 

론리 곱하기 set , icc 

SAVE 

등록기창문 전진 

ANDN 

론리곱하기부정 

RESTORE 

창문 뒤로 이동 

ANDNCC 

론리 곱하기 부정 set , icc 

RETT 

추적으로부터의 복귀 

OR 

론리 더하기 

기타 명령 

ORCC 

론리더하기 set , icc 

SETHI 

높은 22개 의 bit 설정 

ORN 

론리더하기부정 

UNIMP 

무실행명령 (추적) 

ORNCC 

론리더하기부정 set , icc 

RD 

특수등록기 읽기 

XOR 

안맞음론리더하기 

WR 

특수등록기 쓰기 

XORCC 

안맞음론리 더 하기 set , icc 

IFLUSH 

캐 쉬 초기 화명 령 

XNOR 

안맞음론리더하기부정 



XNORCC 

안맞음론리 더 하기 부정 set , icc 
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명 령 모임 에서 리 용할수 있는 ALU 연산들은 크게 다음과 같이 나누어 볼수 있 다. 

• 옹근수더 하기(자리 올림 이 있거 나 없는것 ) 

• 옹근수덜 기 (자리 내 림 이 있거 나 없는것 ) 

• 비 트단위 의 론리 곱하기 ( AND ) ，론리 더 하기 ( OR ) ，안맞음론리 더 하기 ( XOR ) 와 그것 
들의 부정 

• 론리왼쪽밀기，론리오른쪽밀기 혹은 산수오른쪽밀기 

밀기를 제외한 이 모든 명령들은 4 개의 조건코드들(령，부수，자리넘침，자리올림)을 선택 
적 으로 설정할수 있다. 옹근수들은 32 bit 로 된 2 의 보수양식 으로 표현한다. 또한 단순한 
넣기 및 기억명령들만이 기억기를 참조한다. 

자료의 형 이 단어 (32 bit ), 배단어，반단어 및 바이 트인가에 따라서 서 로 다른 넣 기 
및 기억명령들이 있다. 반단어와 바이트의 경우에는 부호가 있거나 부호가 없는 수들로 
따로따로 고찰하여 이 수들을 넣는 명령들이 있다. 부호 있는 수들은 32 bit 의 목적등록 
기를 다 채울 때까지 부호가 확장된다. 부호 없는 수인 경우는 령을 채운다. 

등록기주소지정 방식외 에 리 용할수 있 는 주소지정 방식 은 오직 변위주소지정 방식뿐이 
다. 이 방식에서 연산수의 유효주소는 등록기에 있는 주소로부터의 변위와 갈다. 

유효주소 =( R sl )+ S 2 
혹은 유효주소 =( R s 1 )+( R s2 ) 

여기서 두번째 연산수는 직접값 혹은 등록기참조로 된다. 넣기 및 기억을 수행하기 위하 
여 부가적 인 주기단계 가 명 령 주기 에 추가된다. 두번째 주기단계 에서는 ALU 를 리 용하여 
기 억기주소를 계산한다. 결국 넣기 및 기 억은 세번째 주기단계 에서 진행된다. 이 주소화 
방식은 매우 융통성 이 있으며 표 12-15 에서 보여 준바와 같이 다른 주소화방식을 합성 
하는데 리용할수 있다. 


표 12-15. SPARC 주소지 정 방식 과 다른 주소지 정 방식 의 합성 


방 식 

알고리듬 

등가적인 SPARC 

명령형 

직접값 

연산수 =A 

S 2 

등록기-등록기 

직적값 

유효주소 =A 

R 0 + S 2 

넣기，기억 

등록기 

유효주소 =R 

Rsi ’ Rs 2 

등록화—등록기 

등록기간접 

유효주소 =( R ) 

R S1 + 0 

넣기，기억 

변위 

유효주소 =( R)+A 

Rsi + S 2 

넣기，기억 


SPARC 의 주소지정능력을 MIPS 와 비교해 보면 MIPS 주소화방식은 16 bit 의 변위를 
리 용하지 만 SPARC 는 13 bit 의 변위 를 리 용한다. 또한 MIPS 는 두 등록기 의 내 용으로부 
터 주소를 얻지 않는다. 

3. 명령형식 

MIPS R 4000 에 서 와 같이 SPARC 는 32 bit 명 령 형 식 을 가진 단순한 명 령 모임 을 리 용 
한다(그림 12-13). 모든 명령들은 2 bit 의 조작코드로 시작한다. 어떤 명령에서는 그 형식 
에 추가적으로 조작코드비트들이 확장되기도 한다. 호출명령에서는 2의 보수양식으로 된 
32 bit 의 PC 상대주소를 가지도록 30 bit 의 직접값연산수의 오른쪽에 두개의 령 비트들이 
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확장된다. 모든 명 령들은 이와 같은 양식 으로 주소지정 을 할수 있도륵 32 bit 의 한계 로 
정렬된다. 

분기명 령은 4개의 표준조건코드비트들에 대 응하는 4 bit 의 조건마당을 포함하며 이 
것을 리용하여 임의로 결합된 조건들을 검사할수 있다. 22 bit 의 PC 상대주소는 22 bit 
의 2의 보수 상대주소를 가지도록 오른쪽에 2개의 령비트가 확장된다. 분기명 령의 특수 
한 특징은 취소비트에 있다. 취소비트가 설정되지 않은 경우에는 분기가 일어 나건 상 
관없이 늘 분기의 다음명 령 이 실행된다. 이것은 많은 RISC 기계들에서 볼수 있는것으로 
서 이 미 이 장의 제 5 절의 전형 적 인 지 연분기 연산에 서 론의 한것 이 다(그림 12-7 참고) . 취 
소비트가 설정된 경우에는 분기명령에 뒤따르는 명령이 분기가 취해 진 조건에서만 실 
행된다. 처리장치는 명령이 이미 관흐름에 있다고 해도 그 명령의 작용을 억제한다(결 
과를 취 소시 킨다. ) . 이 취 소비 트는 를파일 러 가 조건분기 에 뒤따르는 지 연름을 보다 쉽 
게 메우도록 하는데 효과적으로 리용되는 비트이다. 분기목표가 있는 명령은 분기가 

2 30 


호출형식 


분기형식 


SETHI 형식 


류점수 
형식 
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그림 12-13. SPARC 명 령형식 
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일어 나지 않는 경우 그 명령이 취소될수 있으므로 늘 지연름에 넣어 지게 된다. 이 기 
술이 필요하게 되는 리유는 조건분기명령들이 일반적으로 그 시간의 절반이상을 차지하 
기 때문이다. 

SETHI 명령은 32 bit 의 값을 넣거나 기억시키는데 리용되는 특별한 명령이다. 이 명 
령은 주소나 큰 상수들을 넣거나 기억하는데 리용된다. SETHI 명령은 22 bit 의 직접값 
연산수로 등록기 의 22 개 의 높은자리비 트들을 설정하며 낮은 자리 10 개 의 비 트들에 는 0 
을 설정 한다. 13 bit 의 직접값상수는 일반적 인 형식들중의 어느 한가지로 규정될수 있으 
며 이 러한 명 령은 등록기의 나머지 10개의 비트들을 메우는데 리용될수 있다. 넣기 혹은 
기억명령은 또한 직접주소지정방식을 실현하는데도 리용될수 있다. 기억기의 위치 k 로부 
터 값을 넣 기 위하여 다음과 갈은 SPARC 명 령 들을 리 용할수 있 다. 

sethi %hi ( k ) ， % r 8 : 기 억 기위 치 k 주소의 높은자리 22 bit 를 등록기 r 8 에 넣 기 

Id [% r 8+% lo ( k )]，% r 8 : 위치 노의 내용을 ] *8 에 넣기 

마크로 %hi 와 %lo 는 기억기위치의 적당한 주소비트들을 이루는 직접값연산수들을 정의 
하는데 리 용된다. SETHI 의 리 용은 MIPS 의 LE)I 명 령의 리 용과 류사하다(표 12-12). 

류점수형식은 류점수연산을 위해 리용된다. 이를 위해 두개의 원천등록기들과 한개 
의 목적등록기가 지정된다. 

넣기，기억，산수 및 론리연산과 같은 다른 모든 연산들은 그림 12-13 에서 보여 준 
마지막 두가지 형식중 어느 하나를 리용한다. 이 두가지 형식중 하나는 두개의 원천등록 
기들과 하나의 목적등록기를 리용하며 다른 하나는 하나의 원천등록기，하나의 13 bit 직 
접값연산수，하나의 목적등록기들을 리용한다. 

제 8절. RISC 와 CISC 의 비교 

오랜 기간에 걸쳐 콤퓨터구성 방식과 구성에 대한 일반적 인 발전추세는 처 리장치의 
복잡성을 더 증대시키는 방향이였다. 즉 보다 많은 명령，보다 많은 주소지정방식，보다 
전용화된 등록기들을 가진 복잡한 처 리장치를 만드는 방향으로 발전하였다. RISC 의 성 
장은 이러한 경향속에서 그의 기본원리를 근본적으로 깨뜨렸다. RISC 체계의 출현과 
RISC 의 우점을 극구찬양하는 지지 자들에 의해 발표된 론문들은 사실상 를퓨터구성 방식 
의 기본흐름이라고 할수 있을 정도로 이에 반작용을 일으켰다. 

RISC 방식의 우점 을 론증한 연구는 크게 두가지 부류로 나누어 진행 되 였다. 

• 정 량적 인 고찰 :비 교기 술을 리 용하여 RISC 와 CISC 기 계 들에 서 프로그람의 크기 와 
실 행 속도비 교 

• 정성적인 고찰: 고급언어의 지원과 현존 VLSI 기술의 최적리용 등의 평가 

정 량적 인 평 가를 위 한 대 다수 연구는 RISC 체 계 에 대 한 연구를 진행하는 사람들에 
의 해 진 행 되 였 으며 ([ PATT 82 b ] , [ HEAT 84] , [ PATT 84]) 기 본적 으로 RISC 방식 이 더 
좋다는것을 론증하는 방향으로 나갔다. 일부 연구자들은 이 문제를 고찰하여 납득할만한 
결 과를 주지 못하였 다 ([ COLW 85 a , FLYN 87, DAVI 87]). 이 와 같은 비 교를 진행하는데 
서는 여 러가지 문제점들이 있다. 
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• 생명주기비용，기술수준，문회로복잡성，콤파일러의 부작용，조작체계의 지원 등 
을 비 교할수 있는 RISC 와 CISC 콤퓨터 들의 쌍이 없 다. 

• 프로그람들의 확정적인 검사모임이 존재하지 않는다. 성능은 프로그람에 따라 변한다. 

• 를파일 러작성 에서의 기 량으로 말미암아 효과들중에서 하드웨 어효과를 구별하기 가 
힘들다. 

• RISC 에 대 한 대 다수 비 교분석 은 상품화되 여 판매 되 는 콤퓨터 들에 서가 아니 라 
《 장난감》기 계 들에서 진행하였 다. 게 다가 RISC 로써 고찰한 대 다수 기 계 들은 
RISC 와 CISC 의 특성들을 다같이 가지고 있다. 또 RISC 의 《장난감》기계들과 
의 좋은 비교로 될수 있는《순수一놀이》용 CISC 기계 ( VAX , Pentium ) 도 없다. 

다음으로 정상적 인 평 가는 거의 해석과 추측에 의한 평 가이 다. 여 러 연구자들이 이 
평 가에 관심을 돌렸으나 그 결과는 기껏 해서 모호한것이 였다. 물론 그 가운데는 일정 하 
게 론거가 있는것도 있고 그렇지 못한것도 있다. 

최근년간에 RISC 와 CISC 의 비 교판정은 거의나 하지 않는다. 그것은 기술이 점 차적 
으로 하나로 집초되였기때문이다. 소편밀도가 높아 지고 하드웨어속도가 증가함에 따라 
RISC 체 계도 보다 복잡한 체계로 되 였다. 이와 함께 최대성능을 달성 하기 위한 노력 으로 
CISC 설계 에서도 전통적 으로 RISC 와 관련된 문제 점들에 중점을 두고 있다. 즉 일반등록 
기수를 늘이며 명 령관흐름설계를 강화하는 방향으로 나가고 있다. 
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련습문제 

1. 그림 4-29 의 호출一복귀패 런을 생각하면서 다음의 창문크기 에서 얼마만한 자리넘 
침 혹은 아래자리넘침이 일어 나겠는가를 설명하시오. 

ᄀ) 5? 

니 8? 
n ) 16? 

2. 그림 12-2 의 론의에서는 창문에서 첫 두개의 부분만이 보관 혹은 회복된다는것을 
설 명하였 다 . 왜 림 시 등록기 들에 보관할 필 요가 없는가? 

3. 제 12 장 제 5 절에서 고찰한 여러가지 관흐름처리방식을 리용하여 주어 진 프로그 
람인 경우 그의 실행시 간을 결정하려 고 한다. 이제 

iV =실행명령의 수 
D =기억기호출수 
J =뛰여넘기 명령의 수 

라고 하자. 간단한 순차방식 (그림 12-6 1) 인 경우 실행시 간은 2 N+D 주기 단계 이 다. 
두방향，세방향，네방향관흐름처 리 인 경우 그 공식들을 유도하시오. 

4. 고급언어에서 다음과 같은 코드조각을 고찰해 보자. 
for I in 1... 100 loop 

s — s + Q ( I).VAL 
end loop ； 

이제 Q 가 32 byte 의 레코드배 렬 이고 VAL 마당은 매 레코드의 첫 4 byte 에 있다 
고 하자. 80486코드를 리 용하면 이 프로그람조각을 다음과 같이 번역할수 있다. 

MOV ECX ， 1 ; I 를 유지 하기 위 해 등록기 ECX 를 리 용 

LP ： IMUL EAX , ECX , 32 : EAX 에 변위 를 넣 기 

MOV EBX , Q [ EAX ] : VAL 마당을 넣 기 

ADD S , EBX :은에 더하기 

INC ECX ;1의 1증가 

JNE LP ;1=100까지 순환 

이 프로그람은 IMUL 명령을 리용하고 있다. 이 명령은 둘째 연산수를 셋째 연산수 
인 직 접 값에 곱하고 그 결 과를 첫 연산수에 배 치한다(문제 10-13 참고) . RISC 지 지 
파는 훌륭한 콤파일 러 에서 는 IMUL 과 같이 불필요하게 복잡한 명 령 들은 제거할수 
있 다고 보고 있 다. 우의 80486 프로그람을 IMUL 을 리 용하지 않고 다시 작성 하여 
이와 같은 론증을 해보시오. 

5. 다음과 같은 순환고리를 고찰해 보자. 

■it = o ； 

for K := 1 to 100 do 
S := S - 1; 
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이것을 일반아쌤블리언어로 직접 번역하면 다음과 갈다. 


LD 

LD 

Rl ， 

0 


S 의 값을 R1 에 유지 

R2, 

1 


K 의 값을 R2 에 유지 

SUB 

Rl , 

Rl , 

R2 

s ：= s-i 

BEQ 

R2, 

100, 

EXIT 

KXL00 이 면 수행 

ADD 

R2, 

R2, 

1 

기 타이면 K 를 증가 

JWP 

LP 



고리의 시작으로 가기 


RISC 콤퓨터인 경우 콤파일러 는 처 리장치가 지연분기기 구를 채 용할수 있도록 이 
코드에 지 연름을 도입한다. JMP 명 령은 그것 이 늘 SUB 명 령을 동반하므로 취급하 
기 가 쉽다. 그러 므로 JMP 명 령 은 다음의 지 연름에 단순히 SUB 명 령 을 복사해 놓을 
수 있다. BEQ 는 간단치 않다. BEQ 다음에 ADD 명령이 여러번 실행되므로 현재 
상태에서는 이 코드를 버릴수 없다. 따라서 NOP 명령이 필요하게 된다. 결과적인 
코드를 보여 주시오. 

6. 표 12-8 에 다음의 처 리 장치 들을 추가적 으로 넣 으시 오. 

ᄀ . Pentium II 

l . PowerPC 

7. MIPS 명령모임의 한 부분으로서 목록화되여 있지 않는 일반기계명령들은 많은 경 
우 단일 MIPS 명 령 으로 합성할수 있다. 다음의 경우에 이것을 보여 주시오. 

등록기 대 등록기이동 
l . 증가，감소 
n . 보수 
쓿.부정 
° ■ 지 우기 

8. SPARC 는 K 개의 등록기 창문을 가진다. 물리 등록기의 수 N 이 라는것은 무엇 인가? 

9. SPARC 는 CISC 콤퓨터들에서 일반적으로 볼수 있는 여러개의 명령들을 가지고 있 
지 않다. 이들중 일부는 늘 0 으로 설정되는 등록기 R0 과 산수연산수를 리용하여 
쉽게 모방된다. 이 렇게 모방된 명 령들은 모조명 령 이 라고 하며 이것은 SPARC 콤파 
일러가 인식할수 있는 명령이다. 다음의 모조명령들이 단일한 SPARC 명령으로 어 
떻게 모방되였는가를 보여 주시오. 

여기서 src 와 dst 는 등록기들을 의미한다(암시 : R0 에 대한 기 억은 무의미 하다. ):. 


A. DEC dst 
o. CLR dst 
x. NOP 

10. 다음의 코드조각을 고찰해 보자. 
if k>10 
L:=k+1 
else 


ᄀ . MOV src, dst NOT dst 

i- . COMPARE srcl, src2 n. NEG dst 
t；. TEST srcl H . INC dst 
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L ： =k-1 ； 


SPARC 아쎔 블러 로 이 명 령 문을 간단히 번 역하면 다음과 같은 양식 으로 된 다. 


sethi 

% hi ( k ),% r 8 

; 기억기위치 k 의 주소의 높은자리 22 bit 를 등록 
기 r 8 에 넣기 

Id 

[% r 8+%10( k )],% r 8 

: 위 치 k 의 내 용을 r 8 에 넣 기 

cmp 

% r 8,10 

; r 8 의 내용을 10과 비교 

ble 

LI 

; ( r 8_10 이 면 분기 


nop 

sethi % hi ( k )，% r 9 

Id [% r 9+%10( k )], r 9 

inc % r 9 

sethi %hi ( L ), %rlO 

st % r 9, [% rl 0+%10( L ) 

b L 2 

nop 


L 1 : sethi 

% hi ( k),%rll 




Id 

[% rll +%10( k )] : 

,% rl 2 : 

위치 k 의 

내 용을 rl 2 에 넣 기 

dec 

% rl 2 


( rl 2) 에서 

1을 덜기 

sethi 

% fi ( L ),% rl 3 




st % rl 2, 

[% rl 3+%10( L )] : 

( rl 2) 을 

위치 : L 에 

기억 


L 2： 

이 코드는 지연분기연산을 허가하는 매 분기명령의 다음에 nop 명령을 가지고 있다. 

1. RISC 콤퓨터와는 아무러한 관계도 없는 표준를파일러최적화는 일반적으로 우 
의 코드에 대 하여 두가지 변환을 수행할수 있는것으로 하여 효과적 이 다. 우의 
코드에서 두개의 넣기명령은 불필요한것이며 두개의 기억명령은 코드내의 각 
이한 위 치로 기 억을 옮기는 경우에는 빠질수 있다. 이 두 변화를 진행한후의 
프로그람을 보여 주시오. 

i _. 우의 코드에서는 SPARC 에 고유한 일부 최적화를 진행할수 있다. ble 후의 nop 
는 지연름안으로 다른 명령을 옮기거나 ble 명령에 대한 취소비트를 설정하여 재 
배치할수 있다. 이와 같은 변화를 한후의 프로그람을 보여 주시오. 

c . 우의 코드에는 불필요한 명령들이 있다. 이 불필요한 명령들을 제거한 결과적 
인 프로그람을 보여 주시오. 


위 치 k 의 내 용을 r 9 에 넣 기 
( r 9) 에 1을 더하기 

( r 9) 를 위 치 L 에 기 억 
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제 13 장. 명령준위병렬화와 슈퍼스칼라처리장치 


명령선택 명령출력 



실행 창各 


♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦ 

♦ 슈퍼스칼라처리장치는 여러개의 독립적인 관흐름을 리용한 처리장치이다. 매개 관 
흐름은 여러개의 단으로 구성되여 있으므로 한번에 여러개의 명령을 조종할수 있다. 
다중관흐름은 새로운 병렬화를 도입하여 여러개의 명령을 한번에 처리할수 있게 하 
고 있다. 

♦ 슈퍼 스칼라처리장치는 명령 준위 병렬화를 리 용하였는데 이것은 프로그람의 명령들을 
병렬로 집행하자는데 있다. 슈퍼스칼라처리장치는 일반적으로 한번에 여러개의 명령 
을 읽어 들이는데 이때 독립적이면서도 병렬로 집행할수 있는 린접명령들을 람색한 
다. 어느 한 명령에 대한 입구가 선행한 명령의 출력에 의존하는 경우 그다음명령은 
갈은 시간에 혹은 선행명령전에 실행될수 없다. 일단 그러한 독립성이 식별되면 처 
리장치는 초기의 기계코드와는 다른 순서로 명령을 출력하고 실현할수 있다. 

♦ 처리장치는 보충된 등록기들을 리용하든가 원천코드안에서 등록기 참조의 이름을 바 
꾸는 방법으로 일부 필요 없는 자료의존성을 제거할수 있다. 

♦ 순수한 RISC 처 리 장치는 명 령관흐름을 최대 로 리용하기 위 하여 흔히 지 연분기명 령 
을 리용하는데 이 방법은 슈퍼스칼라기계에는 적합하지 않다. 대신 대부분의 슈퍼스 
칼라기 계 들은 효과성 을 개 선하기 위하여 전통적 인 분기기 술을 리 용한다. 

♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦ 

처 리 장치기 본방식 의 하나인 슈퍼스칼라방식 이 실현됨 으로써 공통명 령 들인 옹근수와 
류점수연산，넣기，기억 그리고 조건분기명령들을 동시에 초기화하여 독립적으로 실행할수 
있다. 이 방식의 설계에서는 명령관흐름과 관련된 일련의 복잡한 문제가 제기된다. 

슈퍼스칼라설계는 RISC 기 본방식 에 거의 접근하고 있다. RISC 기 계의 단순한 명 령 모임 
방식 에 슈퍼스칼라기 술을 받아 들이면 슈퍼스칼라방법 을 CISC 기 본방식에서 도 리용할수 
있 다. 

과 Berkeley RISC 와 같이 실 지 RISC 연구를 시 작한 때 로부터 상품화된 RISC 기 
계 가 나올 때 까지 는 7—8 년 이 라는 기 간이 걸 렸지만 첫 슈퍼 스칼라기 계 가 상품화된것 은 
슈퍼 스칼라라는 말이 세상에 나온 때 로부터 1〜2 년사이 이 다. 슈퍼 스칼라방법 은 오늘날 고 
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성 능극소형 처 리 장치 를 실현하는데 서 표준적 인 방법 으로 되 고 있 다. 

이 장에서는 먼저 고속관흐름기술과 대조를 이루는 슈퍼스칼라방법을 개괄적으로 설 
명한 다음 슈퍼스칼라실현과 관계되는 기본설계항목을 보여 준다. 그다음 슈퍼스칼라기본 
방식의 여러가지 주요실례들을 고찰한다. 마지막으로 슈퍼스칼라설계의 강화된 기술을 보 
여 주는 새 로운 IA -64 기 본방식 을 고찰한다. 

제 1 절. 일반개념 

슈퍼스칼라라는 말이 세상에 처음 나온것은 1987 [ AGER 8 기년이였는데 이것은 스칼라 
명 령의 실행성능을 개선하기 위하여 설계된 기계를 의미하는것이 였다. 이 용어는 제 16 장 
에 서 론의하게 되 는 벡 토르처 리 장치 들과는 대 조를 이 룬다. 거 의 모든 응용프로그람들에 서 
연산의 대 부분은 스칼라량이다. 따라서 슈퍼스칼라방법 은 고성 능일 반목적처 리 장치 들의 발 
전 단계 에 서 다음단계라고 말할수 있 다. 


옹근수등록기묶음 류점수등록기묶음 



기억기 


그림 13-1. 일 반적 인 슈퍼 스칼라구성 [COME95_ 


표 13-1. 고속스칼라결합 
콤퓨터들의 속도증가 


참조 

속도중가 

[TJAD70] 

1.8 

[KUCK72] 

8 

[WEIS84] 

1.58 

[ACOS86] 

2.7 

[SOHI90] 

1.8 

[SMIT89] 

2.3 

[JOUP89b] 

[LEE91] 

2.2 

7 


슈퍼스칼라방법 에 서 기 본요점 은 서 로 다른 관흐 
틈에서 명 령을 독립적 으로 실행할수 있는 능력 이 다. 
이 원리는 명령들이 프로그람순서와는 차이나는 순 
서로 집행되게 한다. 그림 13-1 은 일반적인 슈퍼스 
칼라구성을 보여 주고 있다. 그림에는 여러개의 기능 
장치들이 있는데 그것들의 개개는 관흐름으로 되여 
있으며 여러개의 명령에 대한 병렬실행을 지원한다. 
이 실례에서는 두개의 옹근수, 두개의 류점수 그리고 
하나의 기 억기조작(읽기 혹은 쓰기)들을 갈은 시간 
에 집행하고 있다. 

많은 연구자들이 슈퍼스칼라처 리 장치 들을 발명하 
였는데 그들의 연구결과는 일정한 정 도로 성 능을 개 
선할수 있다는것을 보여 주고 있다. 표 13-1 은 이 러 
한 성능들의 우점을 보여 주고 있다. 성능결과의 차 


이 는 모의하는 콤퓨터 의 하드웨 어 와 응용프로그람의 차이 로부터 생 긴것 이 다. 
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1. 슈퍼스칼라와 슈퍼관흐_ 

보다 높은 성능을 실현하는 다른 한가지 방법은 1988[ JOVP 88] 년에 처음으로 나온 
용어 인 슈퍼관흐름이 라고 말할수 있다. 슈퍼관흐름처 리는 많은 관흐름단들을 리용하면 요 
구하는 과제 들을 박자주기 의 절 반보다 적 은 시 간으로 수행할수 있 다는데 기 초하고 있 다. 
따라서 2 배의 내부박자주기속도를 가지 고 하나의 외부박자주기내 에 두개 의 과제 를 수행 
하는것 으로 된다. 이 방법 에 대 한 하나의 실례 로 MIPS R 4000 을 들수 있다. 

그림 13-2 에서는 이 두 방법을 비교하였다. 그림의 웃부분은 비교기준으로 리용한다. 
비교의 기준으로 되는 관흐름은 한박자주기 에 하나의 명 령을 출력하므로 한박자주기 에 

Key： 실행 


1_기1 해신 校公었 쓰기 | 




기본주기에 따르는 시간 

그림 13-2. 슈퍼스칼라와 슈퍼관흐름의 비 교 


하나의 관흐름단을 수행할수 있다. 관흐름은 명령꺼내기，명령해신，명령실행，결과쓰기의 
4개 단으로 되 여 있 다. 그림 에 서 실 행단은 그물모양으로 표시하였 다. 고려할것 은 여 러 개 
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의 명령을 동시에 실행하고 있다고 해도 어느 한순간에 실행단에는 하나의 명령만이 있을 
수 있다는것이다. 

그림의 다음부분은 한박자주기에 두개의 관흐름을 수행할수 있는 슈퍼스칼라실현을 
보여 주고 있다. 여기에서 주목하여야 할 문제는 매개 단에서 수행되는 기능들은 두개의 
겹치지 않는 부분들로 나누어 지는데 그 개개는 반박자주기내에 실현할수 있다는것이다. 
이 류형 에서 취 하게 되 는 슈퍼관흐름실현은 2 부류라고 말할수 있 다. 마지 막으로 그림 의 
제 일 아래부분은 매 개 단의 두 요구를 병 렬로 실행할수 있는 슈퍼스칼라실현방식을 보여 
주고 있다. 물론 보다 높은 등급의 슈퍼관흐름과 슈퍼스칼라도 실현할수 있다. 

그림 13-2 에서 보여 준 슈퍼관흐름과 슈퍼 스칼라실현방식 에서 는 안정 상태 에서 같은 
시 간에 수행 할수 있는 명 령 수는 갈다. 슈퍼 관흐름처 리된 처 리 장치 는 프로그람의 시 작과 
모든 분기실행에서 슈퍼스칼라처리장치보다 속도가 떨어 진다. 

2. 제한성 

슈퍼스칼라방식은 여러개의 명령을 병렬로 실행할수 있는가 없는가에 관계된다. 명령 
준위병렬 화라는 말은 일반적으로 프로그람을 이루는 명령들이 병렬로 집행될수 있는 정도 
를 의미 하는것 이 다. 콤파일 러 에 기초한 최적화와 하드웨 어기술의 조합에 의 하여 명 령준위 
의 병렬화를 높은 수준에서 실현할수 있다. 령준위의 병렬화를 높이기 위하여 슈퍼스칼라 
기계에 리용되는 설계기술을 시험하기에 앞서 체계가 대처하여야 할 병렬화에 미치는 기 
본제한성 들을 잘 고찰하여 야 한다. 참고문헌 [J0HN91] 에는 다음과 같은 5 개의 제 한성 을 
제 기 하였 다. 


• 실자료의존성 

• 처리 절 차의 존성 

• 자원충돌 

• 출력의존성 

• 반의 존 성 

아래 로 내 려 가면서 이 제 한성 가운데 서 앞의 세 가지 를 먼 저 론의한다. 마지 막두가지 에 
대한 론의는 다음절에서 한다. 

실자료의 의존성 

다음과정을 고찰해 보자. 

add rl, r2 : 등록기 r2 의 내 용을 등록기 rl 의 내 용과 더 하여 등록기 rl 에 

넣기 

move r3, rl : 등록기 난 의 내 용을 등록기 r3 에 넣 기 

두번째 명령은 읽기와 해신은 되지만 첫번째 명령이 실행될 때까지 실행할수 없다. 그 리 

유는 두번째 명령이 첫번째 명령에 의하여 만들어 지는 자료를 요구하기때문이다. 이것을 
실자료의존성 이라고 한다(흐름의존성 혹은 쓰기_읽기의존성 이 라고도 한다.). 

그림 13-3 에는 2 부류 슈퍼스칼라기계에서의 의존성을 보여 주었다. 의존성이 없으면 
두 명령은 읽기와 실행을 병렬로 할수 있다. 만일 첫번째와 두번째명령사이에 자료의존성 
이 있으면 두번째 명령은 첫번째 명령의 실행이 끝날 때까지 걸리는 박자주기만큼 지연된 
다. 일반적으로 임의의 명령은 입력값이 모두 처리될 때까지 지연된다. 

단순한 스칼라관흐름에서는 앞에서 서술한 명령실행과정에 지연이 생기지 않는다. 이 
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기조작이 실행될 때까지 실행될수 없다. 그림 13-3 은 2 부류 슈퍼스칼라관흐름에 대한 분 
기조작의 효과성을 보여 준다. 

이 러한 류형의 처 리절차의존성은 스칼라관흐름에 영향을 준다. 슈퍼스칼라관흐름의 결 
과에는 보다 더 큰 영향을 주는데 그것은 적지 않은 시간을 지연으로 하여 잃어 버 리기때 
문이 다. 

가변길이명령을 리용하면 다른 류형의 처리절차의존성이 생긴다. 왜냐하면 임의의 부 
분명령의 길이를 모르기때문에 다음명령을 읽기전에 최소한 부분적으로 해신하지 않으면 
안되기때문이다. 이것은 슈퍼스칼라관흐름에서 요구되는 동시적인 읽기에 나쁜 영향을 준 
다. 이것 이 슈퍼스칼라기술을 고정된 명 령길이를 가진 RISC 또는 RISC 류형의 기본방식 에 
리용하는 하나의 리유이다. 

자원충돌 

자원충돌이 란 갈은 시 간에 갈은 자료에 대 하여 둘 혹은 그이상의 명 령 들이 경 쟁하는 
것 을 말한다. 자원에 는 기 억 기，캐 쉬，모선，등록기 一 파일 포구와 기 능장치 (례하면 산수- 
론리연산장치의 더하기회로) 들이 속한다. 

관흐름의 견지에서 볼 때 자원충돌은 자료의존성동작과 류사하다(그림 13-3). 그러 나 
여 기 에는 몇 가지 차이점 이 있다. 한가지 차이점은 실자료의존성을 제거할수는 없지 만 자 
원충돌은 자원중첩의 방법으로 극복할수 있다는것 이다. 다른 하나의 차이점은 연산이 오 
랜 시 간 진행 되 는 경우 자원충돌을 적 당한 기 능장치 들을 관흐름처 리하여 최소화할수 있다 
는것 이 다. 


제2 절. 설계의 문제 


1. 명령준우 I 병렬화와 기계병렬화 


[ JOUP 89 a ] 은 명령준위병렬화와 기계준위병렬화의 두 련관개념들사이의 중요한 차이점 
을 제기하였다. 명령준위병렬화는 순차적인 명령들이 서로 독립이고 따라서 겹침에 의하 
여 병렬로 실행될수 있을 때 가능하다. 

명령준위병렬화의 개념을 리해하기 위하여 다음의 두 코드조각을 고찰해 보자 
[ J 0 UP 8%] : 


Load R 1 賣현 R 2 

ADD R :#? R 3, "1" 

ADD R 4 R 4, R 2 


ADD R 3 수 R 3, "1" 
ADD R 4 R 3, R 2 
Store [ R 4 ] ，육 RO 


왼쪽의 세 명령은 독립이며 리론적으로는 셋이 다 병렬로 실행될수 있다. 반대로 오른 
쪽 세 명령은 병렬로 실행될수 없다. 왜냐하면 두번째 명령은 첫번째 명령의 결과를 리용 
하며 세번째 명 령은 두번째 명 령의 결과를 리용하기때 문이 다. 

명 령준위병렬화는 코드안에 실자료의존성 과 처 리절차의존성 이 자주 나타나는가에 따 
라 결정된다. 이 요소들은 명 령모임기 본방식 과 응용프로그람에 의 존한다. 명 령 준위병 렬화 
는 또한 조작도달시 간에 의하여 결정된다. 조작도달시 간은 명 령의 결과가 다음명 령의 연 
산수로 리용될수 있을 때 까지의 시 간이 다. 조작도달시 간은 자료 혹은 처 리절 차 의 존성 이 
얼마만한 지연을 일으키는가에 따라 결정된다. 

기계준위 병렬 화는 명령준위의 병렬화를 리용하는 처리장치의 능력을 규정 하는 척도이 
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다. 기계병렬화는 갈은 시간에 읽거나 실행할수 있는 명령의 수(병렬관흐름의 수)와 독립 
인 명령들을 찾는데 리용하는 기구와 수법에 의하여 결정된다. 

명 령준위 병렬화와 기계 병렬화는 둘다 성능을 높이는데서 중요한 요인이 다. 프로그람은 
기계병렬화를 원만히 리용하기 위한 명령준위병렬화를 충분히 가지고 있지 못할수 있다. 
RISC 와 같이 고정길 이 명 령방식 을 리 용하면 명 령 준위병 렬 화를 강화할수 있 다. 다른 한편 
제한된 기계병렬화는 프로그람성질이 어떠하든 성능을 제한한다. 

2. 명령초기화규약 

이미 언급한것처럼 기계병렬화는 매개 관흐름단계에서 제기되는 여러개의 사건들을 
거의 가지고 있지 않다. 처리장치는 명령준위병렬화를 식별할수 있어야 하며 명령의 읽기， 
해신，실행을 병렬로 조종할수 있어야 한다. 

명 령 실 행 초기 화는 처 리 장치 의 기 능장치 들안에 서 명 령 실 행 을 초기 화하는 과정 을 말하 
며 명령초기화규약은 명령실행을 초기화하는 규약을 의미한다. 

중요한것은 처리장치가 관흐름에 들어 와 집행될수 있는 명령이 놓여 있는 현실행점 
을 찾는것 이다. 이 고찰에서 세가지류형의 순서가 중요하게 고려되고 있다. 

• 명령을 꺼내는 순서 

• 명령을 실행하는 순서 

• 명령이 등록기와 기억주소의 내용을 갱신하는 순서 

처 리장치가 세련되면 될수록 이 순서들사이의 관계는 더욱더 유연해 진다. 여 러가지 
관흐름요소들의 리용을 최적화하기 위하여 처리장치는 엄격한 순차실행에서 찾아 보게 되 
는 순서짜기의 순서들가운데서 하나 혹은 몇개를 바꾸어야 한다. 처리장치에 대한 하나의 
요구는 그 결과가 정확하여 야 한다는것 이 다. 따라서 처 리장치는 앞에서 언급된 여 러가지 
의존성과 충돌에 적응되 여 야 한다. 

일 반적 으로 슈퍼 스칼라명 령 실행초기 화규약은 다음과 같이 분류하여 묶을수 있다. 

• 순차실행의 순차완료 

• 순차실행의 비순차완료 

• 비순차실행의 비순차완료 

순차실행의 순차완료 

제 일 간단한 명 령 실 행 규약은 결 과가 엄 어 질수 있는 정 확한 순서로 명 령을 순차실 행 
하며 그와 같은 순서로 결과를 쓰기하는것이다. 그러나 스칼라관흐름에서는 이러한 규약 
을 쓰지 않는다. 이 규약은 보다 개선된 방식들을 비교하기 위한 기준으로 리용한다. 

그림 13-4 자에 이 규약에 대한 실례를 주었다. 여기서 알수 있는것은 슈퍼스칼라관흐 
틈은 3 개의 개 별적 인 기 능장치 들(례하면 옹근수연산，류수연산)과 재 쓰기관흐름단의 두 
요구에 의하여 한번에 두개의 명령에 대한 읽기와 해 신을 동시 에 할수 있다는것 이 다. 실 
례에서는 6개의 명 령코드부분에 대 하여 다음과 같이 분류하였다. 

• 11은 그 실행에 두 주기를 요구한다. 

• 13과 14는 갈은 기 능장치 를 요구하므로 충돌한다. 

• 15는 14에 의하여 처 리되는 값에 의존한다. 
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순차실행의 비순차완료 

비 순차완료는 스칼라 RISC 처 리 장치 들에 서 리 용되 는데 그것 은 여 러 개 의 박자주기 를 요 
구하는 명령의 성능을 개선한다. 그림 13-4 느는 슈퍼스칼라처리장치에서 비순차완료의 리 
용을 보여 준다. 명령 12 는 명령 11 에 앞서서 실행 이 완료되여야 한다. 그러자면 한주기 
를 절 약하기 위하여 13이 먼 저 완료되 여 야 한다. 

비 순차완료를 가지 므로 임 의의 수의 명 령 들은 모든 기 능장치들로부터 최 대 급의 기 계 
병 렬화에 이르기까지 임의의 시각에는 실행단안에 있게 된다. 

명 령 순차실행 은 자원충돌，자료의 존성 이든가 처 리절차의존성 에 의하여 지 연된다. 
앞에서 언급한 제 한성들과 함께 출력의존성 이라고 하는 새로운 의존성 이 제기되 고 있 
다(이 것 을 일명 쓰기_쓰기 의 존성 이 라고 부른다. ) . 

다음의 코드부분들은 이 의 존성 을 보여 주고 있 다 (0 P 는 연산을 의 미한다) . 


11 : R 3 — R 3 OP R 5 

12 : R 4 — R 3 + 1 

13 : R 3 — R 5 + 1 

14 : R 4 는 R 3 OP R 4 

명령 12 는 명령 11 보다 먼저 실행할수 없는데 그것은 11 에서 처리된 결과가 등록기 
R 3 에 넣 어 져 야 하기때문이 다. 이것 이 제 1절에서 서술된 실지자료의존성의 실례 이 다. 마 
찬가지 로 14 는 13 이 실행될 때 까지 기 다려 야 한다. 그것은 13 에 의 하여 만들어 진 결과 
를 리용하여 야 하기때 문이 다. 11 과 13 사이 에는 어떤 관계 가 있는가? 그것은 사용자가 정 
의했기때문에 여기 에 자료의존성은 없다. 그러 나 13 이 11 보다 앞서서 실행완료를 하였다 
면 R 3 안의 틀린 값이 14 의 실 행 단계 에 서 읽 기 된다. 계 속하여 13 은 정 확한 출력 값을 엄 은 
다음에 13 이 완료되 여 야 한다. 이것을 확보하기 위하여 세 번째 명 령의 출력은 그 결과가 
실행시간이 길어 진 선행명령에 의하여 후에 겹쳐쓰기되는 경우 어느 정도 지연되여야 한 
다. 

비순차완료는 순차완료보다 더 복잡한 명령실행론리를 요구한다. 더우기 새치기와 례 
외명령을 취급하는것은 더 어렵다. 새치기가 발생하면 그 시점에서 명령실행이 중단되였 
다가 후에 다시 복귀된다. 처 리장치는 새 치기가 발생하면 새 치기발생명령보다 전에 있는 
명 령 들이 이 미 완료될 수 있 다는것 을 복귀할 때 고려하여 야 한다. 

비순차실행，비순차완료 

순차실행을 리용하여 처리장치는 의존성 혹은 충돌이 일어 날 때까지 명령해신만을 
할수 있다. 부가명령들은 충돌이 해제될 때까지 해신되지 않는다. 결과적으로 처리장치는 
관흐름안에 이미 있는 명령과 독립이면서 관흐름에 들어 갈수 있는 다음명령과의 충돌점 
을 미 리 예측할수 없다. 

비순차실행을 실현하기 위하여서는 관흐름의 해신과 실행 단계를 분리시켜 야 한다. 이 
분리는 명령 창문이라고 하는 완충기로 실현된다. 이 러한 구성에서는 처리장치가 명령에 
대 한 해 신을 끝낸 다음 그것 을 명 령창문에 넣 어 준다. 완충기 가 완전히 차 있지 않는 한 
처 리장치는 새로운 명 령에 대 한 꺼내기와 해 신을 계속할수 있다. 기능장치 가 실행단에서 
쓸수 있게 되였을 때 명령창문으로부터 나온 명령은 실행단에서 처리된다. 만일 그것이 
리용할수 있는 부분기능장치를 요구하거나 충돌과 의존성이 이 명령을 차단하지 않으면 
임의의 명령이 실행될수 있다. 이러한 구성체계를 가지므로 처리장치는 동시처리를 할수 
있으며 실행단에 들어 올수 있는 독립적인 명령을 식별할수 있다. 명령들은 자기의 원천 
프로그람순서를 거의 무시 하고 명령창문으로부터 출력된다. 이제 남은 문제는 프로그람 


433 






집행이 정확히 되는가 하는것이다. 

그림 13-4 n 는 이 규약을 보여 주고 있다. 매 주기마다 두개의 명령이 해신단에 입력 
된다. 매 주기는 완충기크기의 영향을 받게 되는데 두 명령은 해신단으로부터 명령창문에 
로 이동한다. 이 실례에서 15 에 앞서서 16 명령을 내보낼수 있다 (15 는 14 에 의존하지만 
16 은 의존하지 않는다는것을 다시 상기시 킨다.). 따라서 명 령과 재쓰기단에서 한주기 가 
절 약되 며 그림 13-4 1 • 와 비 교해 보면 끝에 서 끝까지 의 절 약은 한주기 이다. 

그림 13-4 도 에 명 령창문의 역 할을 보여 주었다. 그러 나 이 창문은 관흐름단을 보충한 
것 이 아니 다. 창문안에 있는 명 령은 처 리장치 가 명 령을 관흐름출력할 때 요구되는 충분한 
정 보를 가지 고 있 다는것 을 암시한다. 

비순차관흐름출력，비순차완료규약은 앞에 서 서 술한것 과 갈은 제 약조건의 영 향을 받는 
다. 명 령은 의존성 이 나 충돌을 무시하면 관흐름출력 를 할수 없다. 그 차이 는 관흐름단들이 
지 연될수 있는 가능성을 줄임 으로써 더 많은 명 령을 출력할수 있게 한것 이 다. 그외 에도 
새로운 의존성 이 제기되는데 그것 이 앞에서 언급된 반의존성(혹은 읽기 一쓰기의존성)이 다. 
앞에서 고찰한 코드부분이 이 의존성을 보여 주고 있다. 


11 : 

R 3 

R 3 op R 5 

12 : 

R 4 

— R 3 + 1 

13 : 

R 3 

— R 5 + 1 

14 : 

R 7 

— R 3 op R 4 


명령 13은 명령 12가 집행되기 시작하여 그의 연산수를 꺼내기전에는 실행될수 없다. 
그 리유는 13 이 12 를 위한 원천연산수인 R 3 을 갱 신하기때문이 다. 반의존성 이 라는 말이 
쓰이게 된것은 이것이 실자료의존성과 류사하지만 실제는 반대이기때문이다. 즉 두번째 
명령을 리용하기 위한 값을 만들어 내는 첫번째 명령대신에 두번째 명령이 첫번째 명령이 
리용할 값을 파피한다. 

3. 등록기이■바꾸기 

비순서 명 령 관흐름출력 이 라든가 혹은 비순서 명 령 완료가 허 락되 면 이것은 출력의존성 과 
반의존성 이 일어 날수 있다. 이 의존성은 실자료의존성과 자원충돌과는 달리 프로그람을 
통한 자료흐름과 실행순서 에 영 향을 준다. 다른 한편 출력의존성과 반의존성은 등록기 안 
의 값들이 프로그람흐름에 의하여 받게 되는 값들의 순서에 더는 영향을 미칠수 없게 한 
다. 

명령이 순서대로 관흐름출력되거나 순서대로 완료될 때 실행의 매점에서 매 등록기의 
내용을 규정할수 있다. 비순차기술을 리용하면 프로그람에서 받게 되는 명령의 순차를 고 
려해야 하므로 제때에 매개 점에서의 등록기값을 충분히 알수 없다. 실제로 값들은 등록 
기리용으로 하여 충돌상태에 있게 되며 처리장치는 관흐름을 지연시켜 이 충돌을 풀어야 
한다. 

반의존성과 출력의존성은 모두 기 억기충돌을 일으킨다. 다중명 령들은 갈은 등록기주 
소를 리용하기 위하여 경쟁하므로 성능제고를 방해하는 관흐름제약이 생긴다. 이 문제 
는 제 12 장에 서 론의 된것 처 럼 등록기최 적 화기 술을 리용할 때 더 심 각하다. 그것 은 콤파 
일러기술이 등록기를 최대로 리용하려고 시도하며 이때 기억기충돌의 회수가 최대로커 
지 기 때 문이 다. 

이러한 류형의 기억기충돌을 극복하기 위한 한가지 방법은 전통적인 자원충돌해결법 
인 자원중첩법 에 기 초하고 있다. 여 기 에서는 이 기 술을 등록기이 름바꾸기 라고 한다. 실제 
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R 3 a OP R 5 a 
R 3 b + 1 
R 5 a + 1 
R 3 c op R 4 b 


첨 수가 없는 등록기참조는 명 령안에서 찾게 되 는 론리 등록기참조를 의 미 한다. 첨 수가 
있는 등록기참조는 새 로운 값을 취 하기 위하여 할당된 장치 등록기 를 의 미한다. 부분적 인 
론리등록기에 대하여 새롭게 할당되였을 때 그 론리등록기를 원천연산수로 하는 다음명령 
참조는 가장 최근(명령의 프로그람순차에 대한 견지에서 최근)에 할당된 하드웨 어등록기 
를 참조하게 된다. 

이 실례에서는 13 명령에서 등록기 R 3 c 를 만들어 냄으로써 두번째 명령에 대한 반의 
존성과 첫번째 명령에 대한 출력의존성을 피할수 있으며 이것은 14 에 의하여 호출되는 
정확한 값과 충돌하지 않는다. 그 결과 13 은 즉시 실행될수 있다. 즉 이름바꾸기가 없으 
면 13은 첫번째 명령이 완료되고 두번째 명령이 실행될 때까지 실행될수 없다. 

4. 기계병렬화 

앞에 서 우리 는 성 능을 개 선 하기 위하여 슈퍼 스칼라처 리 장치 에 서 리 용될 수 있 는 3 가지 
하드웨어기술인 자원의 중첩，비순차실행, 이름바꾸기에 대하여 고찰하였다. 이 기술들사 
이의 관계를 보여 주는 한가지 연구내용이 참고문헌 [ SHIT 8 的에 주었다. 이 연구는 모의 
를 리용하여 여러가지 슈퍼스칼라기능이 강화된 MIPSR 2000 의 특성을 가진 기계를 모형 
화하였다. 여러개의 서로 다른 프로그람순서가 모의되였다. 

그림 13-5 에 그 결과를 보여 주었다. 매개 그라프에서 수직축은 스칼라기계에 대한 슈 
퍼스칼라기계의 평균속도제고비에 대응한다. 수평축은 4 개의 서로 다른 처리장치의 구성 
에 대한 결과를 보여 주고 있다. 기준기계는 어떠한 기능장치도 모방하지 않았지만 명령 
을 비 순차로 실 행할수 있 다. 두번째 점 도표는 넣 기 /기 억 을 중첩하여 자료캐 쉬 를 호출한다. 
세 번째 도표는 산수-론리연산장치 를 중첩하였 으며 4 번째 도표는 넣 기 /기 억 산수-론리연산 
장치 를 중첩하였 다. 매 개 그라프에 서 결 과는 8, 16, 32 개 의 명 령 크기 를 가진 명 령 창문에 
대 한것 이며 처 리장치 가 할수 있는 예측량을 그림으로 보여 주었다. 

두 그라프의 차이는 두번째 그라프에서 등록기의 이름바꾸기 가 허 락된것 이 다. 첫번째 
그라프는 모든 의존성 에 의하여 영 향을 받는 기 계를 반영한것 이 라고 말할수 있으며 두번 
째 그라프는 오직 실자료의존성에 의해서만 제한을 받는 기계에 대한것이다. 두 그라프를 
통하여 몇가지 중요한 결과를 얻어 낼수 있다. 

우선 등록기이름바꾸기가 없이 기능장치들을 보충하는것은 거의 의의 가 없다. 그것은 
성능개선이 거의 없고 하드웨어가 복잡해 짐에 따라 가격 이 높아 지기때문이다. 이름바 
꾸기를 하여 반의존성과 출력의존성을 없애면 보다 더 많은 기능장치들을 보충하여 현 


로 등록기들은 처 리 장치 하드웨 어 에 의하여 동적 으로 배 치되며 그것들은 임의의 시 간에 여 
러점에서 명 령에 요구되는 값들과 관련된다. 새로운 등록기값이 만들어 졌을 때 (례하면 
목적연산수로서 등록기를 가지는 명 령을 실행할 때) 그 값을 새 등록기가 할당 받는다. 그 
등록기안의 값을 원천연산수로서 호출하는 다음명 령은 이름바꾸기처 리를 하여 야 하는데 
이 명 령 들에 서 등록기참조는 필요한 값이 들어 있는 등록기 를 참조한것 과 반대 여 야 한다. 
따라서 여 러 개의 서 로 다른 명 령 에서 갈은 원천등록기참조는 서 로 다른 값에 대 하여 서 로 
다른 실지등록기를 참조하는것처 럼 볼수 있다. 

다음의 코드토막을 리용하여 등록기이름바꾸기 가 어떻게 리용되는가를 보기로 하자. 


>11 >11 >-_ >11 

b b c b 
3 4 3 7 
R R R R 

1 :2:3:4: 
1111 
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base= 모든 기능장치 들이 2 중화되 지 않고 순차처 리하는 경 우, 
ld/st= 자료캐 쉬 호출을 위 한 넣 기 /기 억 장치 가 2중화된 경 우, 
alu=ALU 가 2 중화된 경 우, 

1)04=넣 기/기 억 장치 와 ALU 가 둘다 2 중화된 경 우 

그림 13-5. 순차적 인 의 존관계 가 없는 여 러 처 리 장치구성 들의 속도제 고률 

저한 리득을 엄을수 있다. 그러나 여기서 고려해야 할것은 8 개의 명령을 넣을수 있는 명 
령창문과 그보다 더 큰 명령창문을 리용하는것이 큰 차이가 있다는것이다. 그것은 명령창 
문이 너무 작으면 자료의존성으로 하여 많은 기능장치들을 효과적으로 리용할수 없기때문 
이다. 즉 하드웨어를 보다 더 충분히 리용하기 위하여 처리장치는 독립적인 명령을 찾기 
위한 보다 앞선 탐색을 할수 있어 야 한다. 

5. 분기예측 

고성능관흐름기계는 분기명 령 을 처 리 하기 위 해 관흐름출력를 주소화하여 야 한다. 례 
하면 Intel 80486 은 분기다음의 명령을 꺼내거나 분기하려는 명령을 꺼내는 방법으로 이 
문제를 주소화하였 다. 그러 나 미 리꺼 내기와 실행사이 에는 두개의 관흐름단이 있기때 문에 
이 방법은 분기가 생기면 두주기의 지연이라는 손해를 보게 된다. 

RISC 기계의 출현과 더 불어 지 연분기방법 이 개 발되 였다. 이 방법은 처 리장치 가 임의의 
쓰지 않는 명령들을 미리꺼내기전에 조건분기명령의 결과를 타산해 두어야 한다. 이 방법 
을 리용함으로써 처리장치는 항상 분기다음에 오는 명령 하나를 실행한다. 이것은 처리장 
치 가 새 로운 명 령흐름을 꺼 내 는동안 관흐름기 능을 충분히 유지 하게 한다. 

슈퍼스칼라기 계 가 발전하면서 지 연분기방법 은 흥미 가 적 어 졌 다. 그 리유는 다중명 령 
을 명령의존성과 관계되는 일련의 문제를 발생시키는 지연슬로트안에서 실행하여야 하기 
때 문이 다. 그리하여 슈퍼스칼라기 계 는 선행 RISC 에 서 쓰던 분기예 측기 술을 리용하였 다. 
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PowerPC 601 과 같은 일 부 기 계 들은 단순한 정 적 분기예 측기 술을 리용하고 있 다. PowerPC 
620 ， Pentium II 와 같은 보다 개 선된 처 리 장치 들은 분기 경 력 해 석 에 기 초한 동적 분기 예 측기 
술을 리용한다. 

6. 슈퍼스칼라실행 

여기서는 프로그람의 슈퍼스칼라실행에 대하여 개괄한다. 그림 13-6 에서 이것을 보여 
주었다. 실행되 는 프로그람은 선형순차명 령 으로 되 여 있다. 이것은 프로그람작성 자에 의하 
여 작성되 든가 를파일 러 에 의하여 발생 된 정 적프로그람이다. 분기예 측을 포함한 명 령꺼 내 
기 처 리는 동적 명 령 흐름을 형성하는데 리 용된다. 이 흐름은 의존성들을 검사하여 처 리 장치 
의 인공적 인 의 존성 을 제 거할수 있 다. 그다음 처 리 장치 는 명 령 들을 실 행 창문에 넣 는다. 이 
창문에서 명 령들은 더는 순차성을 이루지 않지만 자기의 실자료의존성 에 따라서 구조화된 
다. 처 리 장치 는 실 자료의 존성 과 하드웨 어 자원리 용가능성 에 의하여 결정된 순서 에 따라 매 
개 명 령의 실행단을 동작시 킨다. 최종적으로 명 령들은 순차적 인 순서 로 다시 놓이게 되며 
그 결과들이 기록된다. 


명령순서선택 명령관흐름출력 



이 마지막단계를 명령의 재구성이라고 한다. 이 단계는 다음과 같은 리유로 하여 필요 
하다. 병렬적이며 다중인 관흐름을 리용하기때문에 명 령들은 정적프로그람에서 보여 준것 
과 다른 순서로 실행될수 있다. 더우기 분기예측과 추측실행이 리용됨으로써 일부 명령들 
은 실행을 완료할수 있으며 그때 그것들이 표현하는 분기가 취해 지지 않기때문에 금지되 
여 야 한다. 그러 므로 영구기 억기 와 프로그람작성 자가 쓸수 있는 등록기 들은 명 령실행 이 
끝나는 즉시 갱 신될수 없다. 결과들은 종속명 령 이 리용할수 있는 몇개종류의 림시기 억기 
안에 넣어 지며 그다음 순차모형 이 명 령을 수행 했다는것 이 결정되 였을 때 에는 변하지 않 
는다. 

7. 슈퍼스칼라실현 

지 금까지 의 론의 에 기 초하면 슈퍼 스칼라실 현에 요구되 는 처 리 장치 하드웨 어 에 대 한 몇 
가지 일반적인 해설을 할수 있다. [ SM 3 T 95] 에서는 다음과 같은 주요요소를 제시하였다. 
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조건분기명령의 결과를 예측하거나 그것이 없이 꺼내기하는 방법으로 동시에 여러 
개의 명령을 꺼내는 명령꺼내기기술 

이 기능은 다중관흐름꺼 내기 및 해 신단들의 리용과 분기 예측론리를 요구한다. 
등록기값들을 포함한 실자료의존성 을 결정 하기 위 한 론리와 실행 하는데 필요한 위 
치 에 이 값들을 전송하기 위 한 기구 

여러개의 명령을 병렬로 초기화하거나 관흐름처리하기 위한 기구 
다중관흐름처리된 기능장치들과 다중기억참조를 동시에 봉사할수 있는 기억기의 계 
층구조를 비롯한 여러개의 명령을 병렬로 실행하기 위한 자원들 
처리상태를 정확한 순서로 기억해 두기 위한 기구 


제 3 절 . Pentium II 

스칼라설계의 개념은 일반적으로 RISC 기본방식과 관련되지만 이와 같은 슈퍼스칼라원 
리를 CISC 기계 에도 적용할수 있다. 이 에 대 한 가장 명백한 실례 로는 Pentium II 를 들수 
있다. Intel 계 렬에서 슈퍼스칼라개 념의 발전과정 은 주목할만한 가치 가 있다. 80486 은 슈퍼 
스칼라요소를 가지 고 있지 않는 단순한 전통적 인 CISC 기계 이다. 초기 에 나온 Pentium 은 
두개 의 개 별적 인 옹근수실 행 장치 를 리용할수 있게 구성한 낮은 수준의 슈퍼스칼라요소로 
되 여 있 었 다. Pentium Pro 는 완전 한 슈퍼 스칼라설 계 를 도입 하였 다. Pentium II 는 MMX 실 행 
장치 가 보충된것 외 에 Pentium Pro 와 본질 적 으로 같은 슈퍼 스칼라구성 을 가지 고 있 다. 

Pentium II 에 대 한 일 반적 인 구성 도를 그림 4_23 에 보여 주었 다. 

슈퍼스칼라구성 에 서 기 본구성 요소들은 명 령꺼 내 기 및 해 신장치，명 령선택 및 실 행장치， 
재 구성장치 이 다. 이 에 대 하여 간단히 개 괄한 다음 차례 로 이 장치 들에 대 하여 보기 로 한 
다. 





적 으로 Pentium II 의 기 본방식 은 내 부에 RISC 핵 심 을 가지 고 외 부에 CISC 월 J 
. 내부의 RISC 마이크로조작코드는 최소한 11 단으로 된 관흐름을 통과한다 ( 
길부 경우에 마이크로연산은 다중실행단을 요구한다. 이것은 Intelx 86 처 리장치 
에 서 리 용되 는 5 단(그림 11-18) 으로 된 관흐름과 대 조를 이 분다. 


명령꺼내기와 해신장치 

13-8 은 Pentium II 의 명 령 꺼 내 기 와 해 신장치 를 간단히 보여 준것 이 다. 꺼 내 기 











서 일부가 분기명 령 이 라면 그 장치는 동적분기예측기 에 대응하는 기 억주소를 넘긴다. 그 
다음 IFU2 는 IFU3 에 16byte 로 된 블로크를 넘 긴다. 여 기서 IFU3 은 해 당한 해 신기 에서 리 
용할 명 령을 배 렬하는 기능을 수행한다. 

IFU3 의 조작을 리해하자면 명령해신기의 첫단인 ID1 을 알아야 한다. 이 단은 3 개의 
Pentium II 기계명 령을 병 렬로 조종할수 있다. ID1 은 모든 기계 어명 령을 각각 118bitRISC 명 
령 으로 된 1 〜 4 개 의 마이 크로조작코드로 변환한다. 비 교할 때 주의하여 야 할것 은 가장 단 
순한 RISC 기 계 는 명 령 길 이 가 32bit 로 되 여 있 다는것 이 다. 보다 복잡한 Pentium 조작을 하 
기 위하여서는 보다 긴 마이크로조작코드길이가 요구된다. 그럼에도 불구하고 마이크로연 
산은 그것을 발생 시 키는 원천명 령 보다 관리 하기 가 쉽 다. ID1 은 3 개의 해 신기 로 되 여 있다. 
이들중에서 첫번째것 은 Pentium 명 령 을 조종하여 4 개까지의 마이크로연산코드로 변환한다. 
두번째 와 세번째해 신기들은 하나의 마이 크로조작코드로 변환되는 단순한 Pentium 명 령을 
조종하는데 이 명 령 들은 등록기一등록기 명 령 들로 되 여 있다. ID 1 의 구조에 적 응시 키 기 
위 하여 IFU3 은 필요하다면 16byte 로 된 완충기 안의 첫 번째 명령이 복합명령이고 그다음의 
두 명령이 단순명령이 되도록 그 완충기의 내용을 회전시킨다. 만일 세 명령이 다 단순명 
령이면 회전조작이 필요 없다. 여러개의 명령 이 복합명 령 이면 그때 그 명령들은 두번째와 
세번째해신기들이 복합명령으로 표현되지 않도록 단안에 ID 1 로 있어 야 한다. 

극히 일부 명령들이 4 개이상의 마이크로연산을 요구하는 경우가 있다. 이 명령들은 
마이크로명 령순서기 (MIS) 에로 전송되는데 이 순서기는 복잡한 기계어명령과 관련된 마이 
크로조작코드의 렬 (5 혹은 그이 상) 이 들어 가는 마이 크로코드 ROM 을 말한다. 례 하면 문 
자렬명령은 대단히 많고(심지어 수백개) 반복적인 마이크로코드순서로 변환된다. 따라서 
마이 크로명 령 순서 기 (MIS) 는 제 4 편에 서 론의 된 마이 크로프로그람화된 장치 이 다. 

ID1 혹은 MIS 의 출력은 한번에 6 개의 마이크로조작코드까지 블로크화할수 있는 해신 
장치 ©2 의 두번째 단에 입 력된다. ID2 는 원천프로그람의 순서로 마이크로조작코드의 행 
렬 을 짓 는다. 여 기 에서 두번째 분기예 측을 하게 된다. 만일 조작코드가운데서 분기 가 있으 
면 이 것 들을 정 적 분기 예 측장치 에 넘 겨 주며 그다음 동적분기예 측장치 로 간다. 분기예 측에 
대하여서는 이 절의 마지막에 서술하였다. 

ID2 안에 순차배 렬된 마이 크로조작코드는 등록기할당기 (RAT) 로 알려 진 등록기 과정 을 
통과한다. RAT 는 16 개의 방식 등록기 (8 개의 류점 수등록기 들과 EAX, EBX, ECX, EDX, 
ESI, EDC, EBP, ESP) 에 대 한 참조를 40 개의 물리등록기참조로 재배 치한다. 이 단은 실 
자료의존성 (쓰기후 읽기)을 유지하는 동안 방식등록기의 수가 제한된것으로 하여 생기는 
거 짓 의존성 을 제 거한다. 그다음 RAT 는 수정된 마이 크로조작코드를 재순서완충기 (ROB) 에 
넣 는다. 

2. 재순서완충기 

재 순서 완충기 (ROB) 는 40 개 까지 의 마이 크로조작코드를 취 할수 있으며 또한 40 개 의 하 
드웨 어 등록기 로 된 순환완충기 이다. 매 개 완충기 의 머 리 부는 다음과 같은 마당으로 구성 
되여 있다. 

• 상태마당 : 이 마당은 마이 크로 조작코드가 실행 순서 로 되 여 있는가，실행 을 위하여 
선택 되 였는가，실행 이 완성 되 였는가，재 구성할 준비 가 되 여 있는가를 지 적한다. 

• 기 억주소 : 마이크로조작코드에 의 하여 발생된 Pentium 명 령의 주소，실행 을 위 하여 
선택되 였는가，실행 이 완성되 였는가，재 구성할 준비 가 되 여 있는가를 지 적한다. 

• 마이크로조작코드 : 실제의 조작 
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별명등록기 : 만일 마< 
한다면 이 머리부는 4 

이크로조작코드는 차례 
여 선택 및 해신장치어 
- 적합한 실행장치와 꼭 
.작코드는 차례 로 ROB 
-코드는 매개 마이크로. 
다. 

. 선택 및 실행장치 

림 13-9 에 서 Pentium 도 
다이크로코드를 받으며 


포구 4 


포구 3 


포구 2 


재순서완충기 









키는 기 능을 수행한다. RS 는 ROB 안에서 마이크로조작코드를 찾으며 여기서 상태는 마이 
크로조작코드가 자기의 연산수를 모두 가지고 있다는것을 나타낸다. 만일 그 마이크로조 
작코드에 의 하여 필요되 는 실 행장치 가 연산가능하다면 그때 RS 는 마이 크로조작코드를 꺼 
내 기 위 하여 그것 을 적 당한 실 행 장치 에 로 즉시 에 보낸 다. 한주기 동안에 5 개 의 마이 크로조 
작코드까지 전송할수 있다. 여 러개의 마이크로조작코드가 주어 진 실행장치 를 리용할수 
있다면 그때 RS 는 그것들을 ROB 로부터 차례로 내보낸다. 이것은 순차로 명령을 집행하 
는 일종의 FIFO (선입선출관흐름)이지만 이때에 명령흐름은 실질적으로 비순차적인 의존 
성과 분기 에 의하여 재배렬된다. 

다섯 개 의 포구는 RS 를 다섯 개 의 실 행장치 와 련결 시 킨다. 포구0은 포구1 에 할당되 여 
있는 단순옹근수연산외에 잘못된 분기예측의 조종기능을 가진 옹근수 및 류점수연산에 리 
용된 다. 더우기 MMX 실 행장치 는 이 두 포구사이 에 놓인 다. 나머 지 포구들은 기 억 기읽 기 쓰 
기 용이 다. 

일 단 실행 이 끝나면 ROB 안에 있는 해 당한 머 리부는 갱 신되 므로 실행장치 는 다른 마 
이크로조작을 할수 있다. 

선택 및 실 행장치 를 통한 마이 크로조작의 정 확한 방향은 분기예 측을 잘못하면 파괴 될 
수 있다. 만일 분기예측이 오유로 하여 달라 지면 관흐름으로부터 없애 버려야 할 마이크 
로조작이 여 러개의 처 리단안에 있게 된다. 이 것은 이 행실행장치 가 담당한다. 분기 가 실행 
될 때 분기결 과는 예 측하드웨 어 가 예 측하는것 과 다르게 비 교된 다. 만일 비 교가 일 치하지 
않으면 그때 JEU 장치 는 그것 들을 명 령공유기억 기 로부터 제 거 하기 위하여 분기 뒤 에 놓여 
있는 모든 마이 크로조작코드의 상태 를 바꾸어 놓는다. 그다음 분기예 측을 위해 적 당한 분 
기 목적 지 (분기하여 가려 는 곳)를 제 공하며 새 로운 목적 주소로부터 전체 관흐름을 다시 시 
작한다. 

4. 재구성장치 ( RU ) 

이 장치 는 명 령실행의 결과를 보관하는 재순서완충기 를 관리한다. 먼저 RU 는 잘못된 
분리예 측과 집 행되 였지만 선행 분기 처 리 가 아직 유효하지 않은 마이크로조작을 고려하여 야 
한다. 일단 마이크로조작코드가 집행되 고 잘못된 분기예 측에 의해 동작에 영 향이 없다면 
그것 은 재 구성 을 위한 준비 로 된다. 선행한 Pentium 명 령 이 재 구성 되 고 그다음명 령 의 연산 
조작코드전체가 동작완료를 위한 준비로서 표식되였다면 RU 는 이 명령에 의하여 영향을 
받은 방식등록기 들을 모두 갱 신하여 ROB 로부터 마이 크로조작코드를 삭제한다. 

5. 분기예측 

Pentium II 는 분기명 령의 실행 에 기 초한 동적분기예 측방식 을 리용하고 있다. 분기목적 
완충기 ( BTB ) 는 가장 최 근에 만난 분기 명 령 에 대 한 정 보를 기 억하여 둔다. 분기 명 령 이 명 
령흐름속에 나타났을 때 BTB 를 검 사한다. 만일 머 리 부가 BTB 안에 이 미 존재하면 명 령 
장치는 분기를 예측하겠는가 안하겠는가를 결정하는 그 머리부에 대한 경력정보에 따라 
동작하게 된 다. 만일 분기 가 예 측되 면 이 머 리 부와 관련되 여 있는 분기 목적주소는 분기 목 
적명령을 미리 꺼내는데 리용된다. 

일단 명령이 실행되면 해당한 머리부의 경력부분은 갱신되여 분기명령실행결과에 영 
향을 준다. 만일 이 명령이 BTB 안에 없으면 이 명령의 주소는 BTB 안의 머리부에 넣어 
진다. 필요하다면 오랜 머 리부는 삭제된다. 
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앞의 두절 은 Pentium II 와 Pentium Pro 와 같은 Pentium 이 리 용되 는 분기 예 측방식 을 설 
명 하였 다. 그러 나 Pentium 의 경 우에 상대 적 으로 단순한 2 bit 경 력 방법 이 리 용된 다. Pentium 
Pro 와 Pentium II 는 훨씬 더 긴 관흐름길 이 (Pentium 이 5 단위 인데 비 하여 11 단이 상의 단) 
를 가지며 그러므로 잘못된 예측에 대한 성능은 더 떨어 진다. 따라서 Pentium Pro 와 
Pentium II 는 잘못된 예 측률을 줄이 기 위 하여 보다 더 긴 경 력 비 트를 가진 보다 정 교한 분 
기예 측방법 을 리용한다. 

Pentium II 의 BTB 는 512 행 을 가진 4 통로묶음련상캐 쉬 로 되 여 있 다. 매 머 리 부는 분기 
주소를 꼬리 표로 리용한다. 머 리 부는 또한 이 분기 가 취 해 진 마지 막시 간에 따르는 분기 
목적주소들과 4 bit 의 경력마당으로 되 여 있다. 따라서 4 개의 경 력비트를 리용하는것은 처 
음에 나온 Pentium 과 슈퍼 스칼라처 리 장치 에 서 리 용된 2 bit 와 대 조를 이 룬다. 4 bit 를 리 용 
함으로써 Pentium II 기 구는 분기 예 측에 보다 더 오랜 경 력을 고려 해 둘수 있다. 흔히 리 용 
되 는 알고리 듬으로서 예 흐알고리 듬이 라고 부르는것 이 있 다 [ YEH 91]. 이 알고리 듬의 개 발 
자들은 오직 2 bit 로된 경력을 리용하는 알고리듬과 비교하면 잘못된 예측이 크게 작아 
진 다는것 을 증명 하였 다 [ EVER 91]. 

BTB 안의 경력이 없는 조건분기명령은 다음과 같은 규칙에 따르는 정적예측알고리듬 
을 리용하여 예 측한다. 

• 상대 IP 가 없는 분기주소인 경우 분기 가 복귀하면 예 측이 취 해 지며 그 반대 인 경 
우는 예즉이 취 해 지 지 않는다. 

• 상대 IP 역방향조건분기인 경우 예측이 취해 진다. 이 규칙香 전형적인 순환동작에 
영향을 미친다. 

• 상대 IP 정 방향조건분기 인 경 우 예 측이 취 해 지 지 않는다. 

제 4 절 . PowerPC 

PowerPC 기 본방식 은 IBM 801 ， RTPC 그리 고 RS /6000 과 같은 계 렬 인데 POWER 기 본 
방식 이 실현된것 이 라고 말할수 있다. 이것들은 RISC 기계 이지 만 이 계 렬안에서 첫번째것 
은 슈퍼 스칼라특징 을 가지 고 있으며 그것 이 RS /6000 이 다. PowerPC 기본방식의 첫 실현 
인 6()1 은 RS /6000 과 매 우 류사한 슈퍼 스칼라실 례 이 다. 그다음에 나온 PowerPC 모형 은 보 
다 더 슈퍼스칼라개 념 에 접근하고 있다. 이 절에서 는 RISC 에 기 초한 슈퍼스칼라설계 에 
아주 적 합한 PowerPC 601 에 대 하여 보기 로 한다. 

1 . PowerPC 601 

그림 13-10 에 601 구성에 대 한 일반적고찰을 주었다. 다른 슈퍼스칼라기계 에 비하면 
6()1 은 실행을 더 많이 중첩시키기 위하여 기능장치들을 독립적 으로 구성하였다. 특히 601 
의 핵 심부는 3개의 독립적 인 관흐름실행장치들 즉 옹근수장치，류점수장치 , 분기 처 리 장치 
들로 구성되여 있다. 이 장치들은 공동으로 한번에 3개의 명령을 실행할수 있다. 

그림 13-11 에 기 능장치 들사이 의 명 령 흐름을 강조하기 위하여 6()1 의 기 본방식 의 론리 
적고찰을 보여 주었다. 꺼 내기장치는 캐쉬 로부터 한번에 8 개의 명 령까지 미 리 꺼 낼수 있 
다. 캐쉬는 결합된 명 령 및 자료캐쉬를 지원하며 명 령을 다른 장치 에 넣어 주거 나 자료를 
등록기 에 넣어 주는 기 능을 수행한다. 캐 쉬 중재 론리 는 제 일 높은 호출우선권을 가진 주소 
를 캐쉬 에 보낸다. 
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그림 13-10. PowerPC 6()1 의 블로크도 


선택장치 

선택장치는 캐쉬로부터 명령을 꺼내여 선택대기렬에 넣어 주는데 한번에 8 개의 명령 
을 취 할수 있다. 명 령의 안전한 흐름을 분기처 리 장치，옹근수장치，류점수장치 에 주기 위 
하여 이 명령의 흐름을 처리한다. 대기렬의 웃절반은 명령이 아래절반에로 옮겨 갈 때까 
지 유지하는 완충기기능을 수행한다. 그 목적은 선택장치가 캐쉬로부터 명령이 나오는 시 
간까지 기다리면서 지연되지 않는가를 확인하자는데 있다. 아래절반에서 명령들은 다음과 
같은 방식에 따라 선택된다. 

• 분기처리장치 : 모든 분기명령을 조종한다. 명령선택대기렬의 아래절반의 제일 아래 
명 령은 이 장치 가 그것을 접수할수 있다면 분기처 리 장치 에 로 넘 어 간다. 

• 류점 수연산장치 : 모든 류점 수명 령 을 조종한다. 명 령 선택 렬의 아래 절 반의 제 일아래 
에 있는 명 령은 그 장치안에 명 령관흐름이 차 있지 않으면 류점수장치 에로 실행된 
다. 

• 옹근수연산장치 : 옹근수명령들은 옹근수명령，등록기파일과 캐쉬사이의 읽기，쓰기， 
옹근수비교명 령 을 조종한다. 옹근수명 령 은 그것 이 선택렬의 아래 에 넣 어 진(채 워 
진)후에 야 관흐름장치로부터 출력된다. 

분기 와 류점 수명 령 이 선택렬로부터 순서 가 다르게 출력되 기때 문에 분기처 리 장치 와 류 
점수장치안의 명 령관흐름들이 계속 충만되게 하며 그것은 될수록 빨리 명 령을 선택대기렬 
을 통하여 이동하게 할수 있다. 

선택장치는 또한 미리 꺼내야 할 주소를 계산할수 있는 론리장치를 가지고 있다. 이것 
이 있어 분기명령이 선택대기렬의 아래절반으로 들어 갈 때까지 명령꺼내기를 차례로 계 
속할수 있다. 분기처리장치가 한 명령을 처리할 때 뒤따르는 명령들을 새로운 주소로부터 
꺼내여 선택대기렬에 넣어 지도록 다음꺼내기주소를 갱신할수 없다. 

명령관흐- 

그림 13-12 는 여러 장치에 따르는 명령관흐름을 보여 준다. 모든 명령에 대하여 공통 
인 꺼내기주기가 있는데 이것은 명령이 특별한 장치에서 선택되기전에 일어 난다. 두번째 
주기는 특별한 장치에 대한 명령의 선택을 진행한다. 이것은 그 장치안의 다른 동작과 중 
첩 된다. 매 개 박자주기동안 명 령 선택장치 는 명 령 대 기렬의 아래 의 4 개 머 리 부를 고려하여 
그가운데 서 3개 명 령 까지 선택한다. 

분기명령인 경우 두번째 주기기간 분기예측과과 같이 명령의 해신과 실행을 한다. 마 
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하여 호상관건이나 명령들사이의 의존성을 줄일수 있다. 례하면 를파일러는 다음의 과정 
으로 변환할수 있다 


compare 

branch 

compare 

branch 


compare 

compare 

branch 

branch 


왜 냐하면 매 개 기 능장치 는 그 조건코드를 조건등록기안의 서 로 다른 마당에 보낼수 
있기때 문에 조건코드의 공유에 의하여 생 기는 명 령들사이의 호상관건을 피할수 있다. 

분기처 리 장치안에 보관 및 기 억 등록기 ( SRRs ) 가 있으므로 다른 기 능장치 들에 론리기 능 
을 더 보충하지 않고도 단순한 새치기들과 쏘프트웨어새치기들을 조종할수 있다. 따라서 
단순한 조작체 계봉사는 기 능장치 들사이 의 복잡한 상태조종이 나 동기 화가 없 이 빠르게 실 
현될수 있다. 

601 은 비순차적 으로 분기 와 류점수명 령 을 실행할수 있기때 문에 적 합한 실행 을 담보하 
기 위한 조종이 필요하다. 의존성이 존재할 때(례하면 명령이 선행명령에 의하여 아직 처 
리되 여 야 할 연산수를 가지고 있을 때) 대응하는 장치의 관흐름은 지 연된다. 
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그림 13-12. PowerPC 601 관흐름명 령 




2. 분기처리 


RISC 나 슈퍼스칼라기 계 의 성 능을 높이 기 위한 기 본수법 은 관흐름의 리용을 최 적 화하 
는것이다. 이 설계에서 제일 문제로 되는 요소는 분기조종을 어떻게 하는가 하는것이다. 
PowerPC 에서는 분기처 리를 분기장치 가 담당한다. 이 장치 는 많은 경우에 분기 가 다른 장 
치들의 실행걸음에 영 향을 미치지 않도록 설계되 였으며 이 러 한 류형 의 분기 를 령주기분기 
라고 한다. 령 주기분기 를 실 현 하기 위하여 다음과 같은 방안을 리용하고 있 다. 

1. 분기를 위하여 선택완충기를 주사하기 위한 론리회로가 제공된다. 분기가 대기렬의 
아래절 반에 처 음 나타나고 선행분기 가 없어서 실행 이 미 정 으로 있을 때 분기 목적 주 
소가 생긴다. 

2. 조건분기 의 결과를 결정한다. 조건코드가 충분히 설정 되 였다면 분기 를 결정할수 있 
다. 어 떤 경 우에 는 분기 명 령 이 나타나자마자 론리 회 로가 분기 를 결정한다. 

1) 분기를 취 함수 있는 경 우; 이것은 조건코드가 주어 지 고 분기를 지 적하는 조건분 
기나 무조건분기 인 경우이 다. 

L ) 분기가 취해 질수 없는 경우; 이것은 조건코드가 주어 지고 분기가 없다는것을 
지 적 하는 조건분기 인 경 우에 해 당된 다. 

n ) 출력을 아직 결정할수 없는 경우는 분기 가 역 방향분기(표준적 으로 순환)를 취 함 
수 있고 정방향을 취함수 없는것으로 추측될 때이다. 분기명령다음의 명령들은 
조건방식 에 따라 실 행 장치 에 들어 간다. 일 단 조건코드값이 실 행장치안에 서 만 
들어 지면 분기장치는 관흐름안의 명령을 삭제하고 꺼낸 목적주소에 따라 처리 
를 진행하든가 조건명령에 대한 신호들을 지운다. 콤파일러는 이 표준기동을 예 
약하는데 명령코드로 한비트를 리용할수 있다. 

분기경력에 기초한 분기예측기술은 그리 좋은 방안이 못되므로 받아 들이지 않고 
있 다. 

분기예측의 효과에 대한 실례로서 그림 13-13 에 제시된 프로그람을 고찰해 보면 분기 
처 리장치가 조건분기명령 이 취해 지지 않는다는것을 예측할수 있다(정 방향분기의 표준실 
례). 그림 13-14 자의 실례는 분기가 취해 지지 않는 경우의 관흐름효과에 대하여 보여 주 
었다. 첫번째 주기에서 선택대기렬에는 8개의 명령이 넣어 진다. 첫 6개의 명령은 옹근수 
명령이며 한주기당 1 개의 명령이 옹근수장치에 들어 가게 된다. 조건분기명령은 그것이 
선택대기렬의 아래절반에 갈 때까지 선택될수 없으며 이것은 5 번째 주기에서 일어 난다. 
분기장치 는 이 분기 가 취 해 지 지 않을것 이 라는것 과 다음명 령 이 조건적 으로 선택 된다는것 
을 예측한다 ( D ’ 로 표시된다). 분기는 비교명령이 8 번째 주기에서 실행될 때까지 변하지 
않는다. 그때 에 분기처 리 장치 는 그 예 측이 정 확했고 실행 이 계속되 고 있다는것 을 확인한 
다. 여기에서는 지연이 없으며 관흐름은 한 상태로 있다. 

주목할것은 주기 4 로부터 주기 8 까지의 기간 명령꺼내기를 할수 없다는것이다. 그 리 
유는 캐쉬넣기가 5 개의 넣기명령이 들어 가는 캐쉬호출단으로 하여 2 주기동안 동작상태 
에 있기때 문이 다. 또한 명 령 흐름은 지 연되지 않으며 그로 하여 선택 대기렬은 8 개의 명 령 
을 취 할수 있 다 

그림 13-14 은 예측이 부정확할 때 분기가 취해 지는 경우의 결과를 보여 준다. 이 
경우에 IF 에서 시작하는 3개의 명령을 상기 (다시읽기)하며 ELSE 에서 시작하는 명령 
에서 꺼 내기를 다시 시 작한다. 결과적 으로 옹근수관흐름의 실행단은 주기 9 와 주기 10 
기간 무효이며 (아무 조작도 하지 않는다.) 따라서 부정확한 예측으로 하여 두주기는 
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손실되게 된다. 


3. PowerPC 620 

620 은 PowerPC 기 본방식 에 서 처 음으로 64 bit 를 실 현 하였 다. 

새 로운 G 3 과 같은 이 처 리 장치 의 일 반골격 도를 그림 4-25 에 주었 다. 이 실현에서 
주목할 특징 은 6 개 의 독립 적 인 실행 장치 를 가지 고 있는것 이 다. 

• 명 령 장치 

• 3개의 옹근수장치 

• 읽 기 /쓰기장치 

• 류점수장치 

이 기 본방식 은 처 리 장치 가 세개의 옹근수장치 들과 하나의 류점수장치 에 동시 에 4 개의 명 
령을 전송할수 있는것이다. 


if (a> 0) 

a = a + b + c + d + e; 

else 

a = a - b - c - d - e ； 

자 ) 


lwz r8 = a ( rl) 

lwz rl2=b(rl,4) 

lwz r9 = c(rl,8) 

lwz rl0 = d(rl, 12) 

lwz rll = e(rl,16) 

cmpi crO = r8, 0 

be ELSE, crO / gt = false 


IF ： 


add rl2=r8, rl2 

add rl2=rl2,r9 

add rl2=rl2, rlO 

add r4 = rl2, rll 


b 


a(rl ) = r4 
OUT 


subf rl2 =rl2, r8 

subf rl2=r9, rl2 

subf rl2=rl0, rl2 

subf r4 = rl2, rll 

stw a ( rl ) = r4 


OUT ： 


#rl points to a, 

#rl +4 points to b, 

# rl + 8 points to c, 
#rl +12 points to d, 

# rl +16 points to e, 

# load a 

# load b 

# load c 
#load d 

# load e 

# compare immediate 

# branch if bit false 

#add 

# add 

# add 
#add 

# unconditional branch 

# subtract 

# subtract 

# subtract 

# subtract 

# store 


그림 13-13. 조건분기를 가지는 프로그람실례 
1-C 언어，기계어 
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IF： 


lwz r8 = a (rl) 


be 

add 

add 

add 

add 


rl2 = b(rl,4) 
r9 = c(rl,8) 
rlO = d(rl, 12) 
rll =e(rl, 16) 
crO = r8, 0 

ELSE, crO / gt = false 
rl2 = r8, rl2 
rl2 = rl2,r9 
rl2 = rl2, rlO 
r4 = rl2, rll 


add a ( rl) = r4 

b OUT 


ELSE： 


subf 

subf 

subf 

subf 


rl2 = rl2, r8 
rl2 = rl2,r9 
rl2 = rl2, rlO 
r4 = rl2, rll 


stw a ( rl) = r4 

OUT： 



C 


D 


10 11 12 13 14 15 16 


lwz r8 = a( rl) 

lwz rl2 = b(rl,4) 

lwz r9 = c(rl,8) 

lwz rl0 = d(rl, 12) 

lwz rll =e(rl, 16) 

empi crO = r8, 0 

be ELSE, cr0/gt = false 
IF： add rl2 = r8, rl2 
add rl2 = rl2,r9 

add rl2 = rl2, rlO 

add r4 = rl2, rl 1 

add a ( rl ) = r4 

b OUT 


ELSE： 


subf 

subf 

subf 

subf 


rl2 = rl2,r8 
rl2 = rl2,r9 
rl2 = rl2,rl0 
r4 = rl2, rll 


stw a (rl ) = r4 

OUT： 



D 


E W 
DEW 

DEW 

DEW 

DEC 


F - 꺼 내 기 C - 캐 취 호출 

W- 되쓰기 E- 실행/주소 


D- 선택/해신 
s- 선택 


그림 13-14. 분기예 측 :분기 예 측기 능이 없는 경 우 [WEIS94] 
n- 정확한 예측: 분기되지 않는 경우， i ■-정확하지 않은 예측: 분기되는 경우 
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620 은 고성 능분기 예 측기 술을 리 용하고 있는데 그것 은 실 행 장치안에 예 측론의，등록기 
이름고치기완충기，예약부를 가지고 있기때문이다. 명령이 꺼내질 때 등록기가 기억하는것 
처 럼 명 령결과를 림시 로 보관하기 위하여 개 명완충기를 할당한다. 개명 완충기를 리용하기 
때문에 처 리 장치는 분기예측에 기초한 명 령을 투기적 으로 실행할수 있다. 만일 예측이 부 
정 확한것 이 판명되 면 그때 투기 명 령의 결과는 등록기파일을 파괴 함이 없이 상기될수 있다. 
일 단 분기 의 결과가 일 치하면 림 시 결과는 영 구적 으로 써 넣 을수 있 다. 

매 개 장치는 둘이상의 예 약부를 가지고 있는데 이것은 선택된 명 령을 기 억하며 다른 
명 령들의 결과를 유지한다. 이 런 특징은 명 령장치 에서 이 명 령들을 명백 히 하며 이 장치 
들이 다른 실행장치에 명령을 계속 보낼수 있게 한다. 

620은 4개 의 분해 되 지 않은 분기 명 령 까지 투기 적 으로 집 행할수 없 다. 분기예 측은 2048 
개 의 머 리 부로 된 분기경 력 표의 리 용에 기 초한다. PowerPC 설계 자들에 의 해 진행 된 모의 
실행결과는 분기예측성공률이 90%라는것을 보여 주고 있다 [THOM94]. 

제 5 절 . MIPS R10000 

MIPSR4000 에서 기원하여 명령모임이 같은 MIPS R10000 은 슈퍼스칼라설계원리를 더 
명 백 하고 간단하게 실현하였 다. 그림 13-15 에 그의 총적 구조를 보여 주었 다. 

R10000 명 령 처 리 의 첫 단은 명 령 미 리 해 신 단이 다. 미 리 해 신은 PowerPC 620 과 Ultra Sparc 
를 비롯하여 일련의 슈퍼스칼라기계들에서 찾아 볼수 있는 기능이다. 미리해신의 목적은 
병 렬실행 관흐름의 요구를 만족시 키 는데 있다. 일부 슈퍼 스칼라기 계 에서 의 존성 과 분기 시 
험을 포함한 해신-실행통로는 높은 명령처리능력실현에서 중요하다. 그것은 이 통로를 통 
하여 명령들이 전달되여 다중실행장치들에로 분리되기때문이다. 따라서 이 통로를 잠재적 
인 문제 점 으로 보고 있 다. 해 신-꺼 내 기 통로의 속도를 높이 기 위하여 일부 슈퍼 스칼라처 리 
장치 들은 그것 들의 외 부에 있 는 2 차 캐 쉬 로부터 소자내 부의 명 령 캐 쉬 에 로 읽 기 하는것 처 
럼 명령을 부분적으로 해신한다. 미리해신은 들어 오는 명령을 분류하며 뒤의 처리를 간 
단하게 하기 위하여 매개 명령에 몇개의 해신비트들을 추가한다. R1000 의 경우에 매개 명 
령 에 4 개 의 해 신비 트가 추가되 여 이 명 령 을 선택 할 실행 장치 를 지 적 한다. 

R10000 은 2차캐쉬로부터 한번에 4개의 명령을 꺼내며 그것들은 미리 해신한 다음 명 
령캐쉬에 넣어 진다. 다른 슈퍼스칼라기계들과 마찬가지로 꺼내려는 명령의 수는 최소한 
해신 및 실행속도의 첨수값에 맞추도록 설계된다. 그러므로 R10000 은 병렬로 명령을 4개 
까지 해 신한다. 무조건분기 가 나타나면 그때 늘 다음꺼 내 기를 위 한 지 적자를 조종하기 위 
하여 명 령캐쉬에 분기목적지를 되돌려 준다. 조건분기가 나타나면 해 신단은 2bit 의 경력방 
법 을 리 용하여 분기 예 측을 수행 하는데 이 때 명 령 들은 예 측통로를 통하여 투기 적 으로 꺼 내 
게 된다. 

그다음 단은 등록기이름을 바꾸는 단으로서 5bit 의 론리주소번호(그림 12-8) 가 배 치 
되 여 있다. 해 신단은 론리주소를 물리주소에 로의 배 치와 리용중에 있거 나 리용할수 있는 
등록기 목록을 유지 한다. 

해 신한 다음 R10000 은 매 개명 령 을 3개의 명 령페지 렬가운데서 어 느 하나에 넣는다. 매 
개 대기렬은 16 개 명령까지 취함수 있다. 명령이 선택되여 예약비트는 명령안에 이름이 
규정된 물리적결과등록기를 동작상태로 설정한다. 옹근수 및 류점수명 령 인 경우 그 개별 
적 인 대기렬들은 FIFO 대기렬이 라기보다 예 약부로서의 기능을 수행한다. 즉 명 령은 예 약비 
트에 의하여 표시된데 따라 자료의존성 에 따르는 임의의 순서 로 출력될수 있다. 명 령원천 
연산수에 대한 예약비트가 모두 동작상태가 아닌 경우 명령은 그의 실행장치가 준비되자 
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•자 통과된 다. 주소대 기렬은 읽기, 쓰기 



명령 관호를출력 관흐를처리된 명령장치ᅲ 


그림 13-15. MIPS 10000의 구조 


옹근수와 류점 수등록기파일 들은 각각 64개 의 물리등록기 로 되 여 있 다. 실 행장치 는 등 
록기 파일 로부터 직 접연산수를 읽 어 그 결 과를 다시 직 접 쓰기한다. 다중읽 기 /쓰기포구들 
은 매개 파일에서 병렬호출을 허 락할수 있다. 

R 10000 에는 5 개의 실행장치 가 있는데 그것은 주소계 수기 , 두개의 옹근수산수-론리 
연산장치，류점 수더 하기 장치，나누기 와 두제 곱뿌리 계 산의 다중화를 위한 류점 수장치 로 되 
여 있다. 두개의 옹근수 산수-론리연산장치 는 더 하기，덜기，론리연산을 할수 있다. ALU 1 
은 또한 밀기 와 분기조건조작을 진행한다. ALU 2 는 옹근수곱하기 와 나누기연산을 진행한 
다. 


제 6 절 . UltraSPARC II 


U 1 加 'SPARC II 는 SPARC 처 리 장치 로부터 나온 슈퍼 스칼라기 계 이다. 이 처 리 장치 는 제 
3- 제 7 절에서 서술한것처럼 많은 등록기와 등록기창문을 리용하는것을 비롯하여 동일 
병 령 모임 구성 과 같은 RISC 특성 을 공유하고 있 다. 









류점수명 령/도형처 리명 령 이 
8개의 등록기창문으로 구성그 
1행할수 있 다. 류점 수장치 는 
개의 류점수명령이나 하나의 









리명령을 병렬로 실행할수 있다. 도형처리장치는 SPARC 명령모임에 비쥬얼명령 ( VIS ) 들을 
지 원하고 있다. Pentium II 의 MMX 명 령 과 같이 VIS 는 도형 처 리 를 위 하여 특별히 설정 한 
명령이다. 

읽기/쓰기 장치 ( LSU ) 는 모든 읽기 및 쓰기를 위 한 주소를 만들어 내며 한주기에 하나 
의 읽기 또는 쓰기를 하게 한다. 그러 나 넣기대기렬과 결합하여 하나의 L 2 캐쉬를 호출할 
때 같은 8 byte 주소범 위 까지 다중기 억 을 압축할수 있 다. 

2. 관흐름 


UltraSPARC II 는 옹근수와 류점수 및 도형처 리명 령 을 위 한 두 부분으로 구성된 9 단 
의 명 령 관흐름 (그림 13-17) 을 리 용한다. 옹근수명 령 을 위하여 다음과 같은 관흐름단이 리 
용된 다. 


옹근수관흐쿨 



虛、 N3 쓰 기 

W > 


X2 X3 


류점수와 도형처리관흐쿨 

그림 13-17. UltraSPARC-II 의 명 령 관흐름 



• 꺼 내기단: 한번에 4개까지의 명 령을 명 령캐쉬로부터 꺼 낸다. 

• 해신기단: 이 단은 명령을 해신하여 그것을 명령완충기에 넣는다. 

• 그룹단: 이 단은 명 령완충기 로부터 4개까지 명 령을 선택하여 동시꺼 내 기를 한다. 이 
그룹단에 의하여 두개 의 옹근수명 령이 름과 두개 의 류점 수 및 도형처 리 명 령 이 선택 
될수 있다. 

• 실행 단: 두개의 옹근수 ALU 는 옹근수등록기 파일을 호출하여 옹근수명 령 을 실행한 
다. 이 단은 또한 명 령을 읽기/쓰기하는데 필요한 가상주소를 계산한다. 

• 캐쉬읽기단: 이 단은 앞단에서 만들어 진 가상주소가 캐쉬와 일치 하는가，일 치하지 
않는가 하는것을 결정할수 있다. 실행단으로부터 제 기된 ALU 는 이 단에서 조건코 
드를 발생시키며 이것을 미리꺼내기 및 선택장치에 보내여 분기예측을 검사한다. 
만일 예측오유가 있으면 관흐름안에 이미 있던 명령은 지워 진다. 

• N 1 단: 만일 캐쉬 에 대 한 불일치 가 생기면 L 2 캐쉬와 주기억기 에 대 한 호출을 위 
하여 명령을 읽기/쓰기대기렬에 넣는다. 

• N 2 단: 이 단은 류점수연산관흐름을 위한 대 기단이 다. 

• N 3 단: 트레 프는 이 단에 있는 기 간 해결된다. 

• Write 단: 모든 결과는 이 단에서 등록기파일로 써넣어 진다. 
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류점수명 령관흐름은 옹근수관흐름의 앞의 세 단과 뒤의 두단을 공유하고 있다. 류점관 
흐름의 고유한 단은 아래 의 4개단이 다. 

• R 단: 이 단에 있는 기 간 류점수과 도형처 리명 령은 다시 해 신되며 등록기파일 이 호 
출된 다. 

• XI 단: 류점수명령과 도형처리명령은 이 단에 있는 기간 자기의 실행을 시작한다. 

• X2 단: 실행은 이 단에 있는 기 간 완료된다. 

제 7 절 . IA-64/Merced 

8086 으로부터 시 작되 였으며 가장 성공적 인 콤퓨터제품이 였던 극소형처 리장치계 렬 인 
Pentium II 와 Pentium in 이 자기 의 존재 를 끝마치 고 있 다. Intel 은 Hewlett-Packard (HP) 와 림 
을 묶어 IA-64 라고 불리 우는 새 로운 64bit 기 본방식 을 개 발하고 있 다. IA-64 는 Intel 회 사의 
32bitx86 방식 을 64 bit 로 확장한것 은 아니 며 Hewlett-Packard 의 64bit PA-RISC 구성 방식 에 
맞춘것도 아니 다. IA-64 는 두 회사와 대학들에서 여 러해동안 연구하여 만든 새로운 구성 
방식으로 되여 있다. 이 방식은 병렬화를 체계적으로 리용함으로써 새로운 새 세대의 마 
이 크로소편에 방대한 회 로와 높은 속도를 실현할수 있게 하였 다. 

IA-64 의 기 초로 되 는 기 본개 념 은 다음과 같다 : 

• 처 리 장치 에 의하여 실행 시 간이 결정 되 는것 이 아니 라 기 계 명 령 에 의한 완전한 전용 
명령병렬화 

• 긴 명 령 단어 나 대 단히 긴 명 령 단어 (LIW/VLIW) 

• 분기예 측 (분기예 측과 다름) 

• 투기적인 읽기 

Intel 과 Hewlett-Packard 는 이 개 념 들의 조합을 완전한 전용병 렬 명 령 처 리 (EPIC) 라고 
한다. 이 회사들은 EPIC 라는 말을 기술 혹은 기술의 집 합체 라는 의 미로 리용하고 있다. 
IA-64 는 EPIC 기술을 리용하여 실현한 실제적인 명령모임이다. 이 IA-64 에 기초하여 처음 
으로 개 발하려고 계획 한 제품은 메르쎄드 (Merced) 코드이 다. 같은 IA-64 구성 방식을 가진 
다른 제품들이 계속 나오고 있다. 

표 13-2 는 IA-64 와 전통적 인 슈퍼스칼라방식사이의 주요한 차이 점 을 종합한것 이 다. 
이 차이 점 에 대 하여서 는 이 절의 마지 막에서 론의한다. 

1. 필요성 

Intel 은 x86 명 령방식 과 장치 적호환성 이 없는 새 로운 기 본방식 에 로 전환하는 문제 를 
순간적으로 결정하였지만 이것은 기술발전의 영향을 받게 되였다. 1970년대 말에 x86 계렬 
이 개 발되 기 시 작했 을 때 처 리 장치 에 는 3극소자가 수만개 정 도 집 적 화되 였지 만 슈퍼 스칼라 
장치 로서는 낮은 수준이 였다. 따라서 명 령은 한번에 하나씩 실행되 였으며 관흐름기술은 
거의 리 용되지 않았다. 1980 년대 중엽 에 3극소자의 수가 수십만개 로 늘어 나면서 Intel 은 
관흐름기술을 도입 하기 시 작하였다(그림 11-18). 한편 다른 제 작자들도 3 극소자의 수를 
늘이고 RISC 방법에 기초하여 속도를 증가시키려고 시도하였다. 그리하여 관흐름의 효과 
를 높이기 위한 대책이 세워 졌으며 그후 다중실행장치를 실현할수 있는 슈퍼스칼라와 
RISC 가 결 합된 기 술이 도입 되 였 다. 
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표 13-2. 전통적 인 슈퍼스칼라 대 IA-64 기 본방식 


슈퍼 스칼라 

IA-64 

단어당 하나의 RISC- 행 명 령 

세개의 그룹으로 된 RISC- 행 명 령 

다중병렬실행장치 

다중병렬실행장치 

실행시 간에 명 령흐름의 재순서화 및 최적화 

번역시간에 명령흐름의 재순서화 및 최적화 

한경 로의 추측실 행 을 가전 분기예 측 

한갈래의 두경로에서 추측실행 

필요할 때에만 기억기로부터 자료를 넣기， 

그것이 필요되기전에 자료를 추측하여 넣기, 

캐쉬전반에 있는 자료의 탐색시호_ 

캐쉬전반에 있는 자료의 탐색시.도 


Pentium 을 개 발하면서 Intel 은 두개 의 CISC 명 령 을 동시 에 집 행 하기 위 하여 슈퍼 스칼라기 
술을 도입 하기 시 작하였 다. 또한 Pentium Pro 와 Pentium II 가 CISC 명 령 으로부터 RISC 류형 
의 마이 크로연산과 더 높은 슈퍼스칼라기 술을 리 용할수 있게 하였 다. 그러 나 Pentium II 와 
in 이 후세 대의 처 리 장치 에 서 는 한개 소편에 수천만개 의 3 극소자를 쓰게 되 였다. 

처리장치설계자들은 이 문제를 해결하기 위한 몇가지 방안을 제기하였다. 한가지 
방안은 이 과잉되는 3 극소자들을 소편우의 캐쉬에 넣는것이다. 캐쉬가 커지면 실리가 
적어 지지만 성능은 개선할수 있으며 캐쉬를 더 크게 하면 명중률이 얼마간 개선된다. 
다른 한가지 방안은 실행장치를 더 늘이는 방법 으로 슈퍼스칼라화하는것 이 다. 이 렇게 
하면 설계 가 매 우 복잡해 진다. 실 행장치 를 더 늘이면 처 리 장치 가 커 지 게 되 며 실행장 
치 들사이 동기 를 보장하기 위한 론리 회 로가 보다 복잡해 진다. 따라서 분기예 측을 개 선 
하고 비순서처리를 넣어야 하며 관흐름을 길게 하여야 한다. 그런데 관흐름을 더 많이， 
더 길게 하면 예 측이 틀려 질 가능성 이 더 커 진다. 비순서실행 을 도입하려 면 더 많은 
개 명등록기 들과 종속성 을 관리 하기 위한 복잡한 내 부조종회 로가 요구된 다. 결 과적 으로 
오늘날 가장 훌륭한 처리장치들은 최대로 한주기에 4 개 명령을 출력시킬수는 있으나 일 
반적으로는 그보다 적 다. 

이 문제 를 해결하기 위하여 Intel 과 HP 는 많은 병 렬실행장치를 가진 처 리 장치들을 효 
과적으로 리용할수 있는 전반적인 설계방안을 제안하였다. 이 새로운 방안에서 기본은 완 
전한 병 렬 화의 개 념 이 다. 이 방안에 서 는 처 리 장치 가 실 행 시 간내 에 명 령 을 동적 으로 순서 
화하는것 이 아니 라 콤파일 러 가 번역창문시 간내 에 명 령을 정적 으로 순서 화한다. 콤파일 러 
는 명 령들을 병 렬로 실행할수 있으며 기계 어명 령과 관련된 이 정보를 포함하고 있다는것 
을 결정한다. 처리장치는 이 정보를 리용하여 병렬실행을 한다. 이러한 방안의 우점움 
EPIC 처 리 장치 가 비순서 슈퍼 스칼라처 리 장치처 럼 회 로가 복잡하지 않다는것 이 다. 더 우기 처 
리장치가 잠재적인 병렬실행순간을 결정하는데 수나노초 걸리지만 콤파일러는 오히려 코 
드를 시 험 하고 프로그람을 전체 적 으로 검 사하는데 훨씬 더 많은 시 간이 걸린다. 

2. 구성 

IA-64 는 다른 처 리 장치 에 서 와 마찬가지 로 여 러 가지 로 구성 할수 있 다. 그림 13-18 에 
IA-64 기계의 구성을 보여 주었다. 주요특징은 다음과 같다. 
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• 등록기 가 많은것 : IA -64 명 령 형 
식은 옹근수，론리 그리고 일반 
용으로 128 개 등록기，류점수와 
도형처 리용으로 128 개 등록기 , 
총 256 개 의 64 bit 등록기 를 리 용 
할 수 있 다. 

• 여러개의 실행장치를 가진것: 오 
늘날 전형적으로 상품화된 슈퍼 
스칼라기계는 처리장치의 옹근 
수와 류점수 두 부분안의 4 개 
의 병 렬실 행장치를 리용하여 4 
개 병렬 관 흐름을 지원 한다. 
IA -64 는 앞으로 8 개 혹은 그이 
상의 병렬장치를 가진 체계로 
될것이다. 

IA -64 의 등록기파일 은 대 부분의 
RISC 와 슈퍼스칼라기계에 비 하면 매우 
많다. 그 리유는 높은 수준의 병렬화를 
지원하자면 많은 수의 등록기가 요구 
되 기 때 문이 다. 전통적 인 슈퍼 스칼라기 
계에서 기계어(아쎔블리언어)는 적은 
수의 등록기를 리용하며 처 리 장치는 등록기개명기술과 의존성해석을 리용하여 이것을 보 
다 많은 수의 등록기 들에 배 치한다. 

실 행장치 의 수는 특별 히 제 작한 3극소자의 수에 관계 된 다. 처 리 장치 는 그것 이 가능한 
범위까지 병 렬화를 해 야 한다. 례하면 만일 기계 어 명 령의 흐름이 8 개의 옹근수명 령 을 병 
렬로 집 행 한다면 4 개의 옹근수관흐름을 가진 처 리 장치는 이 것을 두 부분에서 실행하게 
된다. 8개의 관흐름을 가진 처 리장치는 8개의 명 령을 동시 에 다 실행할수 있다. 


3. 명령형식 

IA -64 는 길이가 128 bit 묶음으로 정의되여 있는데 이것은 3 개의 명 령과 템플레트마당 
으로 구성되여 있다(그림 13-19). 처리장치는 명령을 한번에 한묶음씩 꺼낼수 있으며 매 
꺼 내기마다 3 개 명 령을 호출한다. 템플레트마당에는 명 령을 병 렬로 집 행할수 있다는것을 
지적하는 정 보가 들어 있다. 템플레 트마당에 대 한 해석은 하나의 묶음에 국한된것 이 아니 
다(하나의 묶음에 의하여 결정 되지 않는다. ) . 오히 려 처 리 장치는 여 러 개의 묶음을 검 사하 
여 명령을 병렬로 실행할수 있는가를 결정한다. 례하면 명령흐름은 8개 명령을 병렬로 실 
행할수 있으나 콤파일러는 이 8 개의 명령의 린접묶음을 련결할수 있도록 명령의 순서를 
재배치하며 처리장치가 이 8 개의 명령이 독립이라는것을 알수 있도록 템플레트비트를 설 
정 한다. 

묶어 진 명령들은 본래의 프로그람순위와 다르다. 더우기 템플레트마당의 유연성으로 
하여 콤파일 러는 갈은 묶음안에 독립명 령과 종속명 령을 함께 넣 을수 있다. 선행한 VLIW 
설계들과는 달리 IA -64 는 묶음을 채우기 위 하여 무기능연산 ( NOP ) 을 넣을 필요가 없다. 



GR- 일반옹근수등록기 
FR - 류동소수점수 및 도형처 리등록기 
PR - 한비 트예 측등록기 
EU - 실 행 장치 

그림 13-18. IA-64 방식 의 일 반구성 


456 




128bit 한계 


127 - 


명령 2 

명 령 1 

명령 0 

참조 

/ 


、、 


z 




£ _ 


_노 



조작코드 


GPR 

GPR 

GPR 

13 

6 

7 

7 

7 

40bit 명령 


PR - 예측등록기 


GPR- 일반등록기(옹근수 혹은 류점수등록기) 


그림 13-19. IA-64 의 명령형식 


매 개 명 령은 40bit 의 고정 길 이형 식 으로 되 여 있다. 이것은 RISC 와 RISC 슈퍼스칼라기 
계 에서 찾아 볼수 있는 전통적 인 32bit 코드보다(비록 그것 이 Pentium II 의 118bit 짜리 마 
이크로조작코드보다 훨씬 짧기는 하지만) 훨씬 더 길다. 첫째로 IA-64 는 전형적인 RISC 
기계보다 훨씬 더 많은 등록기 즉 128 개의 옹근수등록기와 128 개의 류점수등록기를 가지 
고 있다. 둘째로 예측실행기술을 도모하기 위하여 IA-64 기계는 64 개의 예측등록기를 가 
지 고 있다. 예 측등록기리용은 프로그람작성 자와는 무관계하지 만 예 측등록기참조는 콤파일 
러 에 의하여 명 령안에 규정 되 게 된 다. 그의 리 용을 아래 에 서 설명한다. 

4. 예측실행 

IA-64 의 주요한 두가지 기술은 예측실행과 투기넣 기기술이 다. 그림 13-20 은 이 두 
기술에 대 하여 보여 주었는데 이 에 대 해서 는 이 소제목과 다음소제목에서 론의하게 된다. 

예 측은 콤파일 러 가 어느 명 령을 병 렬로 실행할수 있는가를 결정하는 기술이 다. 번역 
과정 에 콤파일러는 조건실행을 리용하여 프로그람에서 분기를 제거한다. 고수준언어에 의 
한 전형적 인 실례는 if - then-else 명 령 이 다. 전통적 인 콤파일러는 이 구문의 if 점에 조건분 
기 를 넣 는다. 만일 조건이 하나의 론리 적 결과를 가진 다면 분기 를 취 할수 없으며 then 경 로 
에 대응하는 다음의 명 령블로크가 실행된다. 그리고 이 경로의 끝에 else 경 로에 따르는 다 
른 블로크에 대 한 무조건분기 가 있 다. 만일 조건 이 다른 론리 적출력 를 가진다면 분기 는 
명령의 then 블로크에서 취해 지며 명령의 else 블로크에서 실행을 계속한다. 두개의 명령흐 
름은 else 블로크가 끝난 다음 서로 련결된다. IA-64 콤파일러는 다음과 같은것을 한다(그 
림 13-20 1). 

1. 프로그람의 if 점에 비교명령을 넣어 두개의 예측을 만든다. 만일 비교가 진리이 
면 첫번째 예측은 진리로 설정되며 두번째것은 거짓으로 설정된다. 그리고 비교가 
거짓이면 첫번째 예측은 거짓으로 설정되며 두번째것은 진리로 설정된다. 

2. 첫번째 예측의 값을 가지고 있는 예측등록기를 참조하여 then 경로안의 매개 명령 
을 늘이며 두번째 예측의 값을 가지고 있는 예측등록기를 참조하여 else 경로안에 
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있는 매개 명령을 늘인다. 

3. 처리장치는 두 경로에 따라서 명령을 실행한다. 비교결과가 결정되면 처리장치는 
어느 한경 로에 따르는 결과를 버리고 다른 경 로에 따라 결과를 기 억해 둔다. 

실례로 다음의 원천코드를 보기로 하자 
if (a && b) 

j = j + 1 ； 

else 

if (c) 

원천코드: k = k + 1 ； 

else 

k = k - 1 ; 


두개의 if 명 령 문은 3 개의 가능한 실행 경 로가운데서 어 느 하나를 선택한다. 이 것은 
다음의 아쌤 블리 언어 로 번역 되 는데 3 개 의 조건분기 와 하나의 무조건분기 명 령 으로 되 
여 있다. 

Beg a, 0 ， L1 
Beg b ， 0 ， L2 
Jump L3 

아쌤 블리언어 코드: LI ： beg c ， o ， L2 

Add k,k, 1 
jump L3 

L2 ： sub k,k,1 

L3 ： add 1,1,1 

그림 13-21 은 이 아쌤블리언어코드의 흐름도를 보여 준다. 이 흐름도는 아쌤블리 
언어프로그람을 여 러개의 코드블로크로 나누어 표시하였다. 조건에 따라서 집 행하는 
매개 블로크에 대하여 콤파일러는 예측을 할당할수 있다. 이 예측들을 그림 13-21 에 
보여 주었다. 이 예측이 모두 거짓으로 초기화되였다고 하면 그 결과코드는 다음과 같 
다. 

(1) pi, p2 = cmp (a == 0) 

(2) <p2> pi, p3 = cmp ( b== 0) 

(3) <p3> add j, j, 1 결과코드 

예 측된 코드 : (4) <pl> p4, p5 = cmp (c != 0) 

(5) <p4> add k, k, 1 

(6) <p5> sub k, k, 1 

(7) add i, i, 1 

여기 에 3 개의 구문이 있다. 

<PI> 명 령 

이 러한 형의 명령은 예측 미 가 진리 인 경우만 집행되는 형 이 다. 그림 13-19 의 명 
령형 식의 견지 에서 PR 마당은 mt 의 예 측등록기 I 를 지적 하기 위하여 값 I 를 가진다. 
처리장치는 이 명령을 꺼내여 해신한 다음 실행을 시작하지만 예측등록기 I 의 값을 
1( 진리) 혹은 0( 거 짓)으로 정한 다음 결과를 기 억하겠는가 안하겠는가를 결정한다. 
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쪽 else 부분의 더하기 혹은 덜기명령을 수행하겠는가 안하겠는가를 결정한다. 마지막으로 
I 를 무조건 증가시킨다. 원천코드를 고찰한 다음 예측코드를 들여다보면 명령 (3)， (5), 
(6) 가운데서 어느 하나만 실행된다는것을 알수 있다. 흔히 쓰는 슈퍼스칼라처리장치에서 분 
기 예 측을 리 용하여 이 셋중의 어 느 하나를 집 행하며 그 경 로를 따라 가겠는가를 예 측한다. 
처리장치가 오유를 발견하면 관흐름은 재설정된다. IA -64 처리장치는 이 세개의 명령을 다 
실행할수 있으며 일단 예측등록기의 값이 정해 지면 유효명령의 결과만을 기 억한다. 따라서 
보충된 병 렬실행 장치들을 리 용하면 관흐름재설정 으로 인한 지 연을 방지 한다. 

예측실행에 대한 초기연구들은 대부분 일리노이스 ( Illinois ) 대학에서 진행되였다. 연구 
자들이 진행한 모의연구는 예 측을 리 용하는것 이 다중병 렬관흐름처 리 장치인 경 우 실제 적 으 
로 동적 분기 및 분기 예측 오유가 감소되고 성능이 개선된다는 것을 밝혔다 
[ MAHL 94] , [ MAHL 95]. 

5. 투기널기 

IA -64 가 거둔 또 하나의 성과는 투기넣기기술이다. 이것은 처리장치로 하여금 기억 
호출지연을 피 하기 위하여 프로그람이 요구하기전에 자료를 기 억기 로부터 미 리 꺼 내는 기 
술이 다. 또한 처 리 장치는 례외를 통지하는것 이 필요할 때 까지 례외통지 를 연기 한다. 용어 
끌어올리 기는 명 령흐름의 앞쪽으로 넣 기명 령을 옮기는것을 말한다. 

넣기지연을 최소화하는것은 성능개선에서 중요한 자리를 차지한다. 일반적 으로 이미 
코드블로크안에 는 기 억기로부터 등록기 에로 자료를 전송하는 여 러개의 넣기명 령 이 있다. 
왜냐하면 한준위 혹은 두준위의 캐쉬를 더 넣는다고 하여도 기억기는 슈퍼스칼라처리장치 
에 비 하면 속도가 뜨기때 문에 기 억기 로부터 자료를 넣기할 때 호출지연이 문제 로 된다. 
이것을 최소로 줄여 될수록 고속으로 넣기 위하여 코드를 재배렬하군 한다. 이것은 임의 
의 콤파일러를 가지고 할수 있다. 이러한 경우는 조종흐름을 따라서 넣기를 하는 경우이 
다. 넣기는 분기보다 앞에서 무조건넣기를 할수 없는데 그 리유는 넣기가 실지로 생기지 
않을수도 있기때문이다. 자료를 기억기로부터 넣을수 있지만 예측결과가 알려 질 때까지 
방식등록기 에 기 억되지 않도록 예 측을 리용하여 조건에 따라 넣기를 할수 있다. 이 방식 
이 가지고 있는 문제점은 넣기 가 많을수 있다는것 이 다. 무효주소나 폐지오유에 의한 례외 
가 생길수 있다. 이것이 생기면 처리장치는 지연을 발생시키는 요인으로 되는 례외나 오 
유를 처 리 하여 야 한다. 

그러 면 분기 보다 먼 저 어 떻 게 넣 기 를 할수 있 는가? IA -64 에 서 는 이 문제 를 투기 넣 기 
기술로 해결하였다. 여기서는 례외실행 으로부터 넣기실행을 분리한다(그림 13-20 i _). 원 
천프로그람에 있는 넣 기 명 령 은 두개 의 명 령 으로 교체한다. 

• 투기 넣 기 ( Id . s ) 는 기 억 호출을 진 행 하여 례 외 검 사를 하지 만 례 외 를 처 리 하지 는 않는 
다 (OS 루린을 호출하여 례외를 조종한다). ld.s 명 령은 프로그람안에서 선행한 적 
당한 곳으로 올리 밀게 된다. 

• 검 사명 령 (cheek, s) 은 본래 의 넣 기위 치 에 있으면서 례 외 를 관리 한다. 이 cheek, s 명 령 
은 예 측이 진리 인 경 우만 실행할수 있도륵 예 측된다. 

만일 Id . 요 가 례 외를 검사하면 목표등록기 와 관련된 일어 남 (token) 비 트를 설정한다. 대 
응하는 cheek.s 명령이 실행되고 일어남비트가 설정되여 있으면 cheek.s 명령은 례외조종루 
린에 로 이 행한다. 


461 



B 

■ 

■ 


■ 

圖 

a 



圖 


i 


Bl 


■ 

■ 


IB 


g 


田 




■ 


■ 



3 



a 



:： 

i 



a 




福 



D 


m 


■ 





■ 



m 

■ 

L 

a 


그림 13-22. 여덟왕에 대한 문제 


과 3 개의 분기명령으로 되여 있다. 


예측프로그람의 성능을 검사하며 투 
기넣 기의 리용을 증명 하기 위하여 Intel 
회사와 HP 회사가 리용한 실례는《여덟 
명의 왕》문제 이 다. 풀이는 어 느 한 왕이 
임의의 다른 왕을 위협하지 않도록 여 덟 
명 의 왕을 장기 판우에 배 렬하는것 이 다. 
그림 13-22 에 그 한가지 풀이 를 보여 주 
었다. 내 부순환에 서 원천코드의 기 본행 
은 다음과 갈다 

if ((b [j] == true && (a [i +j] == true) && (c [i 
-j + 7] == true)) 

총적과정은 렬이나 두개의 대각선에 
이미 배치된 왕을 다치지 않게 왕을 매 
개 행 에 놓으면서 행 을 따라 움직 이는것 
이 다. B 배 렬은 렬을 검사하며 A 와 C 배 
렬은 두개의 대각선을 검사한다. 

아쌤 블리프로그람은 3 개의 넣기명 령 


아쌤 블리 언어 코드 : 


CD 


R1 = 射) [j] 

⑵ 


Ld R2, (Rl) 

⑶ 


Bne R2, 1, L2 

(4) 


R3 = &a[i + j] 

(5) 


ld R4, (R3) 

(6) 


Bne R4, 1, L2 

(7) 


R5 = &c[i - j + € 

(8) 


ld R6, (R5) 

(9) 


bne R6, 1, L2 

(10) 

LI ： 

<code for then path> 

(11) 

L2 ： 

<code else path 〉 


투기넣기와 예측실행을 리용하면 코드는 다음과 같이 된다. 


투기와 예측코드 : 


(1) 

Rl = &b[j] 

⑵ 

R3 = &a[i + j] 

⑶ 

R5 = &c[i - j + 7] 

(4) 

ld R2, (Rl) 

(5) 

ld.s R4, (R3) 

(6) 

ld.s R6, (R5) 

(7) 

PI, P2 = cmp (R2 == 1) 

(8) 

<P2> br L2 

(9) 

chk.s R4 

(10) 

P3, P4 = cmp (R4 == 1) 

(11) 

<P4> brL2 

(12) 

chk.s R6 

(13) 

P5, P6 = cmp (R5 == 1) 

(14) 

<P6> br L2 

(15) LI ： 

<code for then path> 

(16) L2 ： 

<code for else path> 
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R1 = 射， [j] 

R3 = &a[i + j] 

R5 = &c[i - j + 7] 

Id R2, (Rl) 
ld.s R4, (R3) 
ld.s R6, (R5) 

PI, P2 = cmp (R2 == 1) 

<P1> chk.s R4 

<P1> P3, P4 = cmp (R4 == 1) 
<P3> chk.s R6 

<P3> P5, P6 = cmp (R5 == 1) 
<P6> br L2 
<code for then path> 

<code for else path> 


투기 및 예측된 
수정 코드 : 


이 미 두 예 측을 발생 시키는 한가지 비 교를 진행하였 다. 수정 코드에서 콤파일 러는 거 
짓 예 측에 대 한 분기대 신에 검 사의 실행과 진리 예측에 대 한 다음비 교를 한정한다. 두 분기 
를 제거 한다는것은 두개의 잠재 하고 있는 예측오유를 제거 한다는것을 의미하며 이렇게 되 
면 두개이상의 명령이 절약된다. 

참고문헌과 Web 싸이트 

[J0HN91] 은 슈퍼 스칼라설 계 에 대 한 내 용을 취 급한 좋은 책 이 다. 참고문헌 [SIMT95] 와 
[SMA9 기은 이 문제에 대한 론문을 주로 취급하였다. [JOUP89a] 는 명령준위병렬화에 대 
하여 보여 주고 병 렬화를 최대 로 실현하기 위한 여 러 가지 수법들을 고찰하였으며 모의방 
법 으로 슈퍼스칼라와 슈퍼관흐름방법 들을 비 교하였 다. 

[P0PE91] 은 슈퍼스칼라기 계 를 보다 구체 적 으로 고찰하였다. 또한 비순차명 령실행과 
관련되는 설계항목들에 대한 홀륭한 교과서로 되고 있다. 제한된 체계에 대한 다른 각도 
에서의 고찰은 [KUGA91] 에서 보여 주었다. 이 론문에서는 슈퍼스칼라실현에 대한 중요 
한 설계항목들을 고찰하였다. [LEE91] 은 슈퍼스칼라성능을 개선하는데서 리용할수 있는 
쏘프트웨 어 수법 들을 서 술하였 다. [WALL91] 은 명 령 준위 병 렬 화를 슈퍼 스칼라처 리 장치 에 서 
리용하였 다는것 을 보여 주는 흥미 있는 연구자료를 주고 있 다. 


아쌤 블리언어 프로그람은 3 개의 기본코드블로크로 되 여 있는데 그의 개 개는 조건분리 
를 가진 넣기로 되 여 있다. 아쎔블리언어코드에서 주소설정명 령 4 와 7 은 간단한 산수연산 
명령이다. 이것들은 임의의 시각에 실행될수 있으므로 콤파일러는 이것을 제일 우에까지 
옮길수 있다. 이때 콤파일러는 3 개의 블로크와 맞다 들게 된다. 이 블로크 개개는 넣기， 
조건계산，조건분기로 구성되여 있다. 여기에서는 얼마간 병렬로 실행될수 있다. 더우기 
넣기가 둘 혹은 그이상의 박자주기가 요구된다고 가정하면 조건분기가 실행되기전에 얼마 
간의 시 간이 랑비 된 다. 를파일 러 가 해 야 할것 은 모든 분기 의 우에 두번째 와 세번째넣 기 
(아쎔 블리언어 코드에서 명 령 5 와 8) 를 올려 보내는것 이 다. 이것은 투기넣 기를 제 일 우에 
(명 령 5 와 6) 놓고 원천코드블로크 (명 령 9 와 12) 에 서 검 사를 하는 방법 으로 진행한다. 

이 변환은 3 개의 넣 기를 모두 병 렬로 실행할수 있게 하며 넣 기도달시 간으로 하여 생 
기는 지 연을 최소로 하든가 또는 피 하기 위하여 미 리넣기를 시 작할수 있게 한다. 콤파일 
러는 예측리용을 더 심화시키면 3 개의 분기 가운데서 두개를 없앨수 있다. 
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Web 싸이 트 : 


• Merced / lA -64： IA-64 와 Merced 처 리 장치 에 대 한 최 신정 보를 
가진 Intel 의 싸이 트 

> IMPACT ： 이것은 Illinois 대학의 싸이트이다. 이 대학에서는 예측실행과 관련한 많 
은 연구를 진행하였 다. 이 싸이트를 리용하면 이 와 관련한 수많은 론문들을 볼수 
있 다. 


련습문제 

1. 비순차완료를 슈퍼스칼라처리장치에서 리용하면 새치기처리후 례외조건이 그 결과 
를 비순차적으로 만들어 진 명령처럼 검사할수 있으므로 실행을 다시 계속하는것 
은 복잡하다. 프로그람은 례외명령다음의 명령에서 다시 시작할수 없다. 그것은 다 
음명령이 이미 완료되였고 그렇게 하면 이 명령이 두번 실행되게 되는것으로 된다. 
이 러 한 다룰수 있 는 기 구를 제 기 하시 오. 

2. 다음과 같은 순서로 되여 있는 명령을 고찰하여 보자. 여기서 매개 명령문은 하나 
혹은 두개의 원천등록기와 목적등록기를 가진 조작코드로 이루어 져 있다. 


0 

ADD 

R3, 

Rl, 

R2 

1 

LOAD 

R6, 

[R3] 


2 

AND 

R7, 

R5, 

3 

3 

ADD 

Rl, 

R6, 

R0 

4 

SRL 

R7, 

R0, 

8 

5 

OR 

R2, 

R4, 

R7 

6 

SUB 

R5, 

R3, 

R4 

7 

ADD 

R0, 

Rl, 

RIO 

8 

LOAD 

R6, 

[R5] 


9 

SUB 

R2, 

Rl, 

R6 

10 

AND 

R3, 

R7, 

15 


4 개 단으로 된 관흐름 즉 꺼내기, 해신 및 관흐름출력，실행，되쓰기를 리용한다 
고 하면 모든 관흐름단은 실 행단을 제 외 하고는 한박자주기 를 취 한다고 하자. 간단 
한 옹근수연산 및 론리명 령을 실행 하기 위하여 실행단은 한주기를 취 하지만 기 억 
기 로부터 LOAD 때 문에 실 행단에 서 5 주기 가 소비 된 다. 

만일 단일한 스칼라관흐름으로 되여 있으나 비순차실행을 할수 있다면 첫 6 개 
명 령의 실행 을 위하여 다음과 갈은 표를 구성할수 있다. 

4 개 관흐름단에서의 머리부는 박자주기를 가리키는데 이것은 매개 명령에서의 매 
개 위 상의 시 작을 의 미한다. 이 프로그람에 서 두번째 ADD 명 령 (명 령 3) 은 그의 
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명령 꺼 L 

유 기 

해 신 

실 행 

되 쓰기 

0 ( 

1 : 

) 

L 

1 

2 

2 

4 

3 

9 

2 : 

1 

3 

5 

6 

4 느 

1 

5 

6 

7 

5 J 

5 

6 

8 

10 

6 ( 


7 

9 

12 


연산자가운데 서 比 에 대 하여 LOAD 명 령 (명 령 1) 에 의 존한다. 그것 은 LOAD 명 령 
이 5 박자주기 를 취 하기때 문이 다. 관흐름출력론리 는 두박자후에 의 존성 을 가진 
ADD 명 령과 관계되므로 이것은 ADD 명령을 3 박자주기동안 지연하지 않으면 안된 
다. 비순차론리를 가짐으로써 처리장치들은 박자주기 4에서 명령 3을 지연할수 있 
으며 그때 다음 3개의 독립적인 명령이 관흐름출력된다. 그리고 그것은 박자 6, 8, 
9 에서 실행 에 들어 간다. LOAD 명 령은 박자 9 에서 실행완료한다. 의존성 있는 
ADD 는 박자 10에서 실행 에 들어 갈수 있다. 

1) 처 리표를 완성 하시 오. 

2) 비순차가능성을 예측하는 표를 다시 작성 하시오. 이 가능성을 리용함으로써 
무엇을 절약할수 있는가? 

3) 매개 단에서 한번에 두개 명령을 조종할수 있는 슈퍼스칼라실현을 예측하는 
표를 작성하시오. 

3. PowerPC 601 의 선택 장치 안의 명 령 대 기 렬 에 서 명 령 은 분기 처 리 장치 와 류점 수장치 에 
비순차적 으로 선택될수 있다. 그러 나 옹근수연산장치 에서 명 령은 오직 대 기렬의 
아래 로부터로만 선택 될수 있 다. 이 제 한은 왜 있는가? 

4. 다음의 경 우에 대 하여 그림 13-4 와 같은 그림 을 그리 시 오. 

1) 분기예측: 취한다: 정확한 예측: 분기가 취해 진다. 

2) 분기 예 측 : 취 한다.: 부정 확한 예 측: 분기 가 취 해 지 지 않는다. 

5. 다음의 아쎔 블리언어 프로그람에 대 하여 설명 하시 오 

이 프로그람은 쓰기-쓰기，읽기-쓰기, 쓰기-읽기의존성이 포함되여 있다. 이것을 
찾으시오. 


11 

Move 

R 3, 

R 7 

/ R 3 ft 

( R 7) / 

12 

Load 

R 8, 

( R 3) 

/ R 8 — 

기 억 기 ( R 3)/ 

13 

Add 

R 3, 

R 3, 

4 / R 3 h 

< R 3) + 4 / 

14 

Load 

R 9, 

( R 3) 

/ R 9 수 

기 억 기 ( R 3)/ 

15 

BLE 

R 8, 

R 9, 

L 3 /( R 9)_ 

( R 8) 이면 분기 


6. 그림 13-23 에 슈퍼스칼라처리장치의 내부구성실례를 보여 주었다. 처리장치가 자 
원충돌이 없고 자료의존성문제 가 없다면 한주기당 두개 명 령을 출력할수 있다. 여 
기에는 주로 4 개의 처리단계 (즉 꺼내기，해신, 실행, 기억)를 가진 2 개의 관흐름 
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이 있다. 매 개 관흐름은 자기 자체의 꺼 내기해 신장치와 기 억 장치 를 가지 고 있다. 4 
개 의 기 능장치 (곱하기，더 하기，론리，넣 기장치 )들은 실 행단에 서 리 용할수 있 으며 
동적기 지 우의 두개 의 관흐름에 의하여 공유된 다. 두개 의 기 억 장치 는 두개 의 관흐 
틈에 의하여 동적 으로 리 용될수 있다. lookahead 창문은 자기 자체의 꺼 내기 와 해 신 
론리를 가지고 있다. 이 창문은 이 순차명 령을 출력하기 위하여 명 령을 lookahead 
하는데 리 용된 다. 

이 처리장치에서 실행되는 다음의 프로그람을 설명하시오. 


11 

Load 

Rl , 

A 

/ R 1 


기 억 기 ( A )/ 

12 

Add 

R 2, 

R 1 

/ R 2 

는一 

( R 2) + R ( l )/ 

13 

Add 

R 3, 

R 4 

/ R 3 


( R 3) + R (公/ 

14 

Mul 

R 4, 

R 5 

/ R 4 

는 

( R 4) + R (5) / 

15 

Comp 

R 6 


/ R 6 

七一 

( R 6)/ 

16 

Mul 

R 6, 

R 7 

/ R 3 

'm'- 

( R 3) + R (4) / 



그림 13-23. 슈퍼 스칼라처 리 소자의 2중관흐름처 리 

1) 프로그람안에 어떤 독립성 이 존재하는가? 

2) 순차완료방식 으로 된 비순차출력 과 그림 13-2 와 같은 표현을 리용한 그림 
13-23 의 처 리 장치 에 대 한 우의 프로그람의 관흐름동작을 설 명 하시 오. 

3) 비 순서완료를 가진 순서 출력 에 대 하여 반복하시 오. 

4) 비 순서완료를 가진 비 순서 출력 를 반복하시 오. 

7. 그림 13-24 는 슈퍼스칼라설계 에 대 한 론문에 있는것 이 다. 그림의 3부분을 설명 하 
고 W, X ， Y, Z 를 정 의하시 오. 
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제 4 편. 조종장치 


제 4 편의 중심 

제 3편에서는 매개 명령을 실행함에 있어서 처리장치에서 수행되는 기계어명령과 연 
산들에 중심을 두었다. 여 기 에서 론의하지 못한것은 매 개 별적조작이 어떻 게 일어 나는 
가 하는것 이 다. 이 것 을 담당하는것 이 조종장치 이 다. 

조종장치는 처리장치의 한 부분으로서 처리에 필요한 조종신호를 발생시킨다. 조종 
장치 는 처 리 장치 에 외 부신호를 가하여 기 억 기 및 입 출구모둘과의 자료교환을 진행하게 
한다. 조종장치는 또한 처 리장치에 내부조종신호를 보내여 등록기들사이에 자료를 이동 
하게 하며 ALU 로 하여 금 규정 된 기 능을 수행 하게 하거 나 다른 내 부조작을 조종하게 한 
다. 조종장치 에 가해 지는 입구는 명 령등록기，기 발，외부원천(례하면 새 치기신호들)으로 
들어 오는 조종신호들이다. 


제 4 편의 장별 내용 

제 14장. 조종장치조작 

제 14 장은 조종장치 가 수행 해 야 할 기 능을 설명 하면서 조종장치 의 조작을 설명 한다. 
조종장치 의 기 본사명 은 마이 크로조작이 라고 부르는 요소적인 조작순서 를 명 령주기기 간에 
발생 시 키 는것 이 다. 

제 15 장. 마이크로프로그람조종 

제 15 장에서는 마이크로조작의 개념이 마이크로프로그람이 라고 불리우는 조종장치실 
현의 강력한 방안으로 되였는가를 인식하게 된다. 본질은 저수준프로그람작성언어를 개 
발하는것 이 다. 처 리장치의 기계 어안의 매개 명 령은 순차적 인 저수준조종장치명 령 으로 번 
역 된다. 이 저수준명 령 을 마이 크로명 령 이 라고 부르며 번역 과정 을 마이 크로프로그람화라 
고 한다. 
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제 14 장. 조종장치조작 



♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦ 

♦하나의 명령실행은 일반적으로 주기라고 불리우는 여러가지 부분실행들의 모임으로 
되여 있다. 례하면 하나의 명령실행은 꺼내기주기，간접주기，실행주기，새치기주 
기로 구성되여 있다. 매개 주기는 차례로 마이크로조작이라고 불리우는 여러개의 
기초적인 조작과정으로 되여 있다. 하나의 마이크로조작은 일반적으로 등록기사이 
전송, 등록기 와 외 부모선사이 전송 그리 고 간단한 ALU 조작으로 구성 되 여 있 다. 

♦처 리 장치 의 조종장치 는 두가지 과제 를 수행한다. 

(1) 처 리 장치 가 실 행하려 는 프로그람에 의하여 결정 되 는 마이 크로조작을 일정한 순 
서 로 실 행하게 하며 

(2) 매 개 마이 크로조작을 실행할수 있게 조종신호를 발생 시킨다. 

♦조종장치 에 의하여 발생 되 는 조종신호는 론리 문회 로를 열기 및 닫기 ( ON , OFF ) 하여 
엄 어 지 는데 그 결과 등록기 에 로 자료의 전송(읽 기 쓰기 )과 ALU 조작을 한다. 
♦조종장치를 실현하기 위한 한가지 기술은 배선론리식으로 장치를 실현하는것인데 
여 기서 는 조종장치 가 조합회 로로 구성된다. 현재 기 계 명 령 에 의해 조종되 는 그의 입 
구론리신호들은 한 묶음의 출구조종신호로 전송된다. 

♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦ 

제 9 장에서는 기계명령이 처리장치를 정의하는데 상당한 기일을 요구하였다는것을 
지적하였다. 모든 조작코드의 효과와 주소지정 방식을 포함한 기계 어명 령모임 을 알고 있 
고 리용자가 볼수 있는 등록기묶음을 알고 있다면 처리장치가 수행해야 할 기능을 파악 
할수 있다. 이것은 완전한 파악을 의미하지 않는다. 이외 에도 모선을 비롯하여 외부대면 
부를 알아야 하며 새치기가 어떻게 조종되는가를 알아야 한다. 이러한 리유로 하여 처리 
장치 의 기 능을 규정하는데 필 요한 몇 가지 항목은 다음과 갈다. 
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• 조작코드 

• 주소지정방식 

• 등록기 

• I 八)모둘대면부 

• 기억기모둘대면부 

• 새 치 기 처 리 구조 

이 목록은 어느 정도 완성된것이다. 1성까지의 항목은 명령모임에 의하여 결정된다.항목 
4 와 5 는 전형적으로 체계모선에 의하여 결정된다. 항목 6 은 일부는 체계모선에 의하여 
정의되며 일부는 처리장치가 조작체계에 제공하는 지원의 형태로 정의된다. 

이 6 개의 항목의 목록을 처리장치에 대한 기능요구라고 말한다. 이것들은 처리장치 
가 무엇을 해야 하는가를 결정한다. 이에 대해서는 제 2 편과 제 3 편에서 론의하였다. 이 
제 이 기능이 어떻 게 수행되며 처 리 장치안의 여 러 개 요소들이 이 기능을 수행하기 위하 
여 어떻게 조종되는가 하는 문제에 대하여 고찰하려고 한다. 결국 처리장치의 조작을 조 
종하는 조종장치 를 론의한다. 

제 1 절. 마이크로조작 

이미 프로그람의 집 행 에서 콤퓨터의 조작이 한주기당 하나의 기계명 령으로 되 여 있 
는 명령주기들의 련속으로 구성되여 있다는것을 보았다. 여기서 잊지 말아야 할것은 명 
령주기의 실행과정이 프로그람에서 규정된 명령의 작성순서와 곡갈지 않다는것이다. 그 
것은 분기 명 령 이 있기때 문이 다. 여 기서 론의하려 는것은 명 령의 실행 시 간순서 이 다. 

매개 명령주기는 또 더 작은 단위들로 이루어 졌다. 이 세분화된 단위들은 꺼내기， 
간접 , 실행 그리 고 새 치기주기 인데 이 가운데서 꺼 내기와 실행은 늘 발생한다. 

보통 조종장치를 설계 하자면 이것들을 보다 더 세분화하여 야 한다. 제 11 장에서 관 
흐름을 론의 하면서 개개의 작은 주기는 몇개의 단계 로 되 여 있는데 이 단계의 개 개는 또 
처 리 장치등록기들로 되 여 있다. 이 단계를 마이크로조작이 라고 한다. 앞붙이 마이크로라 
는 말은 매 개 단계 가 매 우 단순하며 대 단히 작다는것 을 의 미한다. 그림 14-1 은 지 금까지 



그림 14-1. 프로그람집행의 구성요소 

론의한 여러가지 개념들의 관계를 보여 주었다. 종합적으로 말하면 프로그람의 실행은 
명령의 순차적실행으로 구성되여 있다. 매개 명령은 보다 더 짧은 부분주기(례하면 꺼내 
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기，간접，실행，새치기)로 이루어 진 명령주기기간에 실행된다. 매개 부분주기의 실행은 
하나 혹은 그보다 더 짧은 마이크로조작으로 이루어 진다. 

마이크로조작은 처리장치의 기능적이며 원리적인 조작이다. 이 절에서는 마이크로조 
작을 통하여 임의의 명령주기사건들이 어떻게 이러한 마이크로조작의 순서로 서술될수 
있는가를 리해하기 위한 마이크로조작을 시험하려고 한다. 그 실례는 간단한것을 리용하 
였다. 이 장의 마지막에 마이크로조작의 개념이 조종장치설계에 어떻게 리용되는가를 보 
여 준다. 

1. 꺼내기주기 

먼저 매개 명령의 시작으로 되면서 명령을 기억기에서 꺼내는 꺼내기주기에 대하여 
보기 로 한다. 설명 을 위하여 그림 11-7 에서 보여 준 구성 을 고찰해 보자. 등록기 는 4 개 
로 되여 있다. 

• 기 억주소등록기 ( MAR ) : 체 계 모선의 주소선과 련결되 여 있다. 이것은 읽 기-쓰기 조 
작을 위한 기 억 주소를 넣 어 둔다. 

• 기 억 완충등록기 ( MBR ) : 체 계 모선의 자료선과 련결되 여 있다. 여 기 에는 기 억기 에 
기 억 시키 거 나 기 억기로부터 읽기 위한 값들이 넣어 진다. 

• 프로그람계 수기 ( PC ) : 꺼 내 려 는 다음명 령 의 주소를 취 한다. 

• 명령등록기 ( IR ): 꺼낸 명령을 기억해 둔다. 

처리장치등록기의 견지에서 꺼내기주기에 대한 동작과정을 보기로 하자. 그 실례를 
그림 14-2 에 주었다. 꺼 내 기주기의 시 작에서 실행하려는 다음명 령의 주소가 프로그람계 
수기 ( PC ) 에 있다. 이 경우에 주소는 11000100 이 다. 첫 단계 는 PC 에 있는 주소를 기 억주 
소등록기 ( MAR ) 에 넣 는다. 왜 냐하면 MAR 를 통해 서 만 체 계모선의 주소선에 련결되 기 때 
문이 다. 두번째 단계는 MAR 에서 명 령을 꺼 내 오는 단계 이 다. 요구되는 주소는 주소모선 
으로 출구되며 이때 조종장치는 READ 신호를 조종모선에 내보낸다. 그 결과가 자료모선 
우에 나타나며 기억 완충등록기 ( MBR ) 에 넣어 진다. 이와 함께 다음명령을 꺼내기 위 한 



H) 


그림 14-2. 꺼내기주기동작과정 
ᄀ- 1단계, L-2 단계, 11-3 단계, 5- 4단계 
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준비 로서 PC 를 하나 증가시 킨다. 그것은 이 두개의 동작(기 억기로부터 단어 읽기와 PC 의 
하나증가)이 서 로 결합되 여 있지 않기때문에 이 두 동작을 동시 에 함으로써 시 간을 절약 
할수 있다. 세번째 단계는 MBR 의 내 용을 IR 에 옮기는 단계 이 다. 이것은 가능한 간접주 
기 기 간 MBR 를 사용하기 위 해 서 이 다. 

따라서 단순한 꺼내기주기는 실제적으로 3 개의 단계와 4 개의 마이크로조작으로 된 
다. 매개 마이크로조작은 자료를 기억기에서 읽어 내거나 기억기에 써넣는 자료옮김을 
포함하고 있다. 이 옮김이 다른것과 관계되지 않는한 시간을 절약하기 위하여 이 여러단 
계 들을 한단계 에 수행할수 있 다. 이 동작과정 을 기 호적 으로 다음과 같이 쓸수 있 다. 
ti ： MAR 홀、 ( PC ) 
t 2 ： MBR 七一 기억기 

PC 는 (PC) + I 

t 3 ： IR ■ 혀 - (MBR) 

여기서 I 는 명령길이와 관계된다. 이 과정에 대하여 여러가지로 설명을 붙일수 있다. 
박자신호는 동기 를 취 하기 위한것 이 며 규칙 적 인 공간박자임풀스를 내 보낸 다. 매 개 박자 
임풀스는 시 간단위 를 정 의한다. 따라서 모든 시 간단위 들은 동일 한 시 간길 이 를 가진다. 매 
개 마이크로조작은 하나의 시간단위내에 수행된다. 기호 호는 시간단위를 의미한다. 말로 
표현하면 아래와 같다. 

• 첫 번째 시 간단위 : PC 의 내 용을 MAR 에 옮긴다. 

• 두번째 시 간단위 : MAR 에 의해 규정 된 기 억 주소의 내 용을 MBR 에 옳긴다.그리 고 

PC 의 내 용을 I 만큼 증가시 킨다. 

• 세 번째 시 간단위 : MBR 의 내 용을 IR 에 옮긴 다. 

여 기서 참고할것 은 두번째 와 세번째 마이 크로조작은 둘 다 두번째 시 간단위내 에 일 어 
난다는것이다. 세번째 마이크로조작은 꺼내기조작에 영향을 주지 않고 네번째 마이크로 
조작과 묶어 질수 있다. 

ti ： MAR — (PC) 

t 2 ： MBR — 기억기 

t 3 ： PC ' ^ (PC) + I 

R — (MBR) 

마이크로조작의 그롭화는 다음과 같은 두가지 단순한 규칙에 따른다. 

1. 일정한 동작순위를 따라야 한다. 즉 (MAR ᅳ ( PC )) 는 ( MBR — 기억기)보다 앞서 
야 한다. 그것 은 기 억 기 읽 기 조작이 MAR 안에 있는 주소를 리 용해 야 하기 때 문이 다. 

2. 충돌을 피해 야 한다. 갈은 시간단위안에서는 갈은 등록기에 대한 읽기쓰기를 하 
지 말아야 한다. 그것은 읽기쓰기를 하면 결과를 예측할수 없기때문이다. 례하 
면 마이 크로조작들인 (MBR— 기 억기)와 (IR— MBR) 를 같은 시 간단위 안에 진 
행하지 않도록 해 야 한다. 

마지 막으로 고려해 야 할것 은 마이 크로조작중에 더 하기연산을 포함한다는것 이 다. 순 
환성 의 중복을 피 하기 위 하여 더 하기 는 ALU 가 수행한다. ALU 가 리 용됨 으로써 ALU 
의 기능과 처 리장치의 구조에 따르는 마이크로조작이 보충적으로 포함되게 된다. 이 장 
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에서는 이에 대하여 론의한다. 

여기에서 서술된 과정과 그림 3-5 의 다음에 있는 소제목들의 내용을 비교해 볼 필 
요가 있다. 이 그림에서는 마이크로조작이 무시되였으며 여기서는 명령주기의 보조주기 
를 수행하는데 마이크로조작이 필요하다는것을 보여 주었다. 

2. 간접주기 

일단 명령을 꺼낸 다음의 단계는 원천연산수를 꺼내는것이다. 우의 실례를 리용하여 
직접 및 간접주소지정된 하나의 주소명령형식을 보기로 하자. 명령이 간접주소를 지적하 
자면 실 행 주기 에 앞서 간접 주기 를 실 행하여 야 한다. 자료흐름은 그림 11-8 에 서 보여 준 
것과 어느 정도 다르며 다음의 마이크로조작이 포함되여 있다. 

ti： MAR — (IR (주소)) 

t 2 : MBR 、기억기 

t 3 : m (주소) — (MBR (주소)) 

명 령의 주소마당은 MAR 에 로 전송된다. 이것은 그다음연산수의 주소를 꺼 내 는데 리 
용된 다. 마지 막으로 IR 의 주소마당은 간접주소라기 보다 현재 직 접주소를 가지 고 있는 
MBR 에 의하여 갱 신된 다. 

이 는 현재 까지 도 간접 주소지 정 에 쓰이 지 않으며 실 행 주기 에 쓸수 있도록 준비 된 다. 
새 치기주기를 고찰하기 위하여 잠간 이 주기를 건너 된다. 

3. 새치기주기 

새치기주기의 끝에서 임의의 가능한 새치기가 발생하지 않았는가에 대한 검사를 진 
행 한다. 새 치 기 가 일어 나면 새 치 기 주기를 실행 한다. 이 주기의 성 질은 한 기계 로부터 다 
른 기 계 까지 크게 변한다. 그림 11-9 에서 보여 주는것 처 럼 간단한 동작과정 을 아래 에 제 
시하였다. 


tl: 

MBR — 

(PC) 

t 2 : 

MAK — 

보관주소 


PC — 

루린주소 

t 3 : 

기억 기 — 

(MBR) 

첫 단계 에서는 PC 의 

내 용이 MBR 에 로 

전송된 다. 목적 은 새 치 기 로부터 복귀 하는 경 


우를 위해 그 주소를 보관하자는데 있 다. 그러 면 MAR 에 는 PC 의 내 용을 보관할수 있 게 
되며 주소가 넣어 진다. 그리고 PC 에는 새치기처리루린의 시작주소가 넣어 진다. 이 두 
동작은 각각 간단한 마이크로조작으로 할수 있다. 대부분의 처 리장치들은 여 러가지 류형 
의 새 치 기 준위 를 제 공하기 때 문에 보관주소와 루린주소를 MAR 와 PC 에 전송되 기전에 보 
관하기 위하여 하나 혹은 그이상의 보충적 인 마이크로조작을 더 하여 야 한다. 임의의 경 
우에 일단 이것이 진행되면 마지막단계로서 PC 의 이전값이 들어 있는 MBR 의 내용을 
기 억 기 에 기 억 시 킨 다. 처 리 장치 는 다음명 령주기 를 시 작할 준비 를 한다. 
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4. 실행주기 


꺼내기，간접 그리고 새치기주기는 단순하면서도 예측할수 있다. 이들 개개는 작으면 
서 고정된 마이크로조작과정으로 되여 있으며 매 경우에 같은 마이크로조작이 매번 반복 
된 다. 

이것은 실행주기의 전 면모가 아니 다. N 개의 서로 다른 조작코드를 가진 기계에는 N 개 
의 서로 다른 마이크로조작이 있게 된다. 몇개의 가상적인 실례를 고찰해 보기로 하자. 

먼저 더하기 명령을 보기로 하자. 

ADD Rl, X 

는 주소표의 내용을 등록기 R 1 에 더한다. 그리고 다음의 마이크로조작과정 이 있게 된다. 

ti ： MAR — (IR (주소)) 

t 2 ： MBR 起기 억기 

t 3 : R ( R 1) + ( MBR ) 

이 제 더 하기 명 령 이 들어 있는 이 로부터 시 작한다. 첫 단계 에 서 IR 안의 주소가 MAR 
에넣어 진다. 그다음 참조된 기억주소를 읽는다. 마지막으로 R 1 와 MBR 의 내용이 ALU 
에 서 더해 진다. 역 시 이것 도 단순한 하나의 실례 이 다. 일부 보충된 마이 크로조작들은 IR 
에 서 등록기참조를 요구하거 나 일 부 종단등록기 에 ALU 의 입 구 혹은 출구를 기 억 시키 는 
것을 요구할수 있다. 

좀더 복잡한 실례를 두가지 더 들어 보자. 공통명 령은 령이면 증가 및 이행명 령 이 다. 
ISZ X 

주소 표의 내용은 하나 증가된다. 결과가 령이면 다음명령을 건너 된다. 마이크로조작순 
서는 다음과 같다. 

ti ： MAR —( IR ) (주소)) 

t 2 ： MBR — 기억기 

t 3 : MBR —( MBR ) +1 

t 4 ： 기억기— ( MBR ) 

IF (( MBK ) = 0) then (PC 聲- 《 PC )+1) 

여기 에 도입된 새 로운 특징은 조건작용이 다. PC 는 ( MBR )=0 이면 하나 증가된다. 이 
검사와 작용은 하나의 마이크로조작처럼 실현할수 있다. 이 마이크로조작은 같은 시간동 
안에 수행되며 이 기 간에 MBR 안에 있는 갱 신된 값은 도로 기 억기 에 기 억된다. 

마지막으로 보조프로그람호출명령을 보기로 하자. 실례로 분기-보관 -주소명령을 보 
기로 하자. 

BSA X 

BSA 명령뒤에 있는 명령의 주소는 주소 X 에 써넣어 지며 주소 X+I 에서 실행을 계 
속한다. 기 억된 주소는 복귀할 때 리 용된다. 이것은 보조프로그람호출을 위한 간단한 수 
법이다. 다음의 마이크로조작은 이것을 충분히 보여 주고 있다. 


ti ： 


MAR (주소) ) 
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실제의 처리장치에 대한 흐름도는 보다 더 복잡하다. 일부 경우에 처리장치의 조작이 마 
이크로조작과정을 수행하는것으로 정 리 할수 있다고 말할수 있다. 조종장치가 이 과정을 
어떻게 발생시키는가를 보기로 하자. 


제 2절. 처리장치의 조종 


1. 기능에 대한 요구 

앞절에서의 해석결과에 따라서 처리장치의 기동과 기능을 마이크로조작이라고 하는 
요소조작으로 분해 하였다. 처 리 장치의 조작을 여 러개의 기능준위 로 줄임 으로써 조종장치 
가 무엇을 해 야 하는가 하는것을 정확히 정의할수 있다. 따라서 조종장치가 수행해 야 할 
기능을 조종장치에 대한 기능요구라고 한다. 이 기능요구에 대한 정리는 조종장치의 설 
계와 실현을 위한 기초이다. 

가까운 정보에 기초하여 다음의 3단계처 리와 조종장치의 특징을 규정한다. 

1. 처 리 장치 의 기 본요소들을 규정한다. 

2. 처 리 장치 가 수행 할 마이 크로조작을 서 술한다. 

3. 마이 크로조작이 수행 될수 있게 조종장치 가 해 야 할 기 능을 규정한다. 

1 단계와 2 단계는 이미 수행되였다. 그 결과를 종합해 보기로 하자. 우선 처 리장치 
의 기본기능요소들은 다음과 같다. 

• ALU 

• 등록기 

• 내부자료통로 

• 외부자료통로 

• 조종장치 

이상의 고찰을 통하여 이것이 비교적 완성된 목록이라는것을 확신할수 있다. ALU 
는 를퓨터의 기 본요소이 다. 등록기들은 처 리 장치 에 내부자료를 기 억 시키는데 리 용된다. 
일부 등록기들은 명 령실행과정을 관리하는데 필요한 상태정보(례하면 프로그람상태단어) 
를 보관한다. 다른 요소들은 ALU ， 기 억 기，입 출력 모둘에 입 력하거 나 출력할 자료를 기 억 
해 둔다. 내 부자료통로는 등록기 들사이 와 등록기 와 ALU 사이 에 자료를 주고 받는데 리 용 
한다. 외부자료통로는 흔히 체계모선을 통해서 등록기를 기억기와 입출력모둘과 련결시 
킨다. 조종장치 는 처 리 장치내 에서 조작이 생 기 도록 한다. 

프로그람의 실행은 이 처리요소들에 대한 조작으로 이루어 진다. 우리가 이미 알고 
있는것처 럼 이 조작은 또한 마이크로조작과정 으로 구성된다. 제 14 장의 제 1 절에서 보여 
준바와 같이 독자들은 모든 마이크로조작이 다음과 갈은 분류가운데서 어느 한 종류에 
속한다는것을 알고 있어 야 한다. 

• 자료를 어느 한 등록기로부터 다른 등록기에로 전송 

• 자료를 등록기 로부터 외 부대 면부(례하면 체 계모선) 에 로 전송 

• 자료를 체계모선으로부터 외부대면부에로 전송 

• 입 출구를 위한 등록기 를 리용하여 산수 및 론리연산의 수행 

명령모임안의 모든 명령을 실행하기 위한 모든 마이크로연산을 비롯하여 하나의 명령주 


477 



기안에 실행해야 할 마이크로연산들은 이와 같이 분류된다. 

조종장치가 어떤 기능을 수행하는가에 대하여 좀 더 명백히 하는것이 필요하다. 조 
종장치는 두가지 기본과제를 수행 한다. 

• 순서작성 : 조종장치는 처 리장치로 하여금 실행하려는 프로그람에 기초한 적합한 
순서로 마이크로조작을 수행하게 한다. 

• 실행 : 조종장치는 매개 마이크로조작이 수행되게 한다. 

앞에서 설명한 내용들은 조종장치가 무엇을 해야 하는가 하는 기능에 대하여 해설 
한것이다. 조종장치를 어떻게 조작하는가 하는 근본열쇠는 조종신호에 있다. 

2. 조종신호 

지금까지는 처리장치를 구성하는 요소들과 수행해야 할 마이크로조작들에 대하 
여 정의하였다. 조종장치가 그 기능을 수행하기 위하여서는 체계의 상태를 결정하는 
입구와 체계의 동작을 조종하기 위한 출구를 가지고 있어야 한다. 이것을 조종장치의 
외적특성이라고 한다. 내부적으로 조종장치는 순서작성과 실행기능을 수행하기 위한 
론리를 가지고 있어 야 한다. 이 책에서는 제 14 장의 제 3 절과 제 15 장에서 조종장치 
의 내 적조작을 주로 설명한다. 이 절의 뒤 에서 조종장치 와 처 리 장치의 다른 요소들사 
이의 호상관계를 고찰한다. 

그림 14-4 는 모든 입구와 출구를 다 보여 준 조종장치의 일반모형 이 다. 그 입구는 
다음과 갈다. 

• 박자: 이것은 조종장치 가《시 간을 맞추기》위한것 이 다. 조종장치 는 매 박자임 풀 
스마다 하나의 마이 크로조작(혹은 동시적 인 여 러 개의 마이크로조작)을 수행한다. 
이것을 때로는 처리장치주기시간 또는 박자주기시간이라고 한다. 

• 명령등록기 : 현행명령의 조작코드를 리용하여 실행주기기간 수행해야 할 마이크로 
조작코드를 결 정한다. 

• 기발: 이것들은 처리장치의 상태와 선택한 ALU 조종의 결과를 결정하기 위하여 종 
장치 에 서 필 요하다. 례 하면 조건 이 령 이 면 증가 및 이 행 하는 명 령 . 



그림 14-4. 조종장치의 모델 
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• 조종모선으로부터 입구하는 조종신호: 체계모선의 한 부분인 조종모선은 조종장 
치에 새치기신호와 응답신호와 같은 조종신호를 보낸다. 

출구신호는 다음과 같다: 

• 처리장치내부의 조종신호: 여기에는 두가지 류형이 있는데 하나는 자료를 어느 
한등록기로부터 다른 등록기에로 옮기게 하는 조종신호이며 다른 한가지는 규정 
된 ALU 의 기 능을 능동으로 하기 위한것 이 다. 

• 조종모선에로 출구하는 조종신호: 이것도 역시 두가지 류형이 있는데 하나는 기 
억기를 조종하기 위한 조종신호이며 다른 하나는 입출구모둘을 조종하기 위한 
조종신호이다. 

이 그림 에 새 로 들어 간 부분은 조종신호이 다. 조종신호에는 세 가지 류형 이 쓰이 
고 있는데 그것들로는 ALU 기 능을 능동으로 만들기 위한 조종신호들과 자료통로를 능 
동으로 만들기 위한 조종신호, 외 부체 계모선 혹은 다른 외 부대 면부를 조종하기 위한 
조종신호이 다. 이 신호들은 모두 개 별적 인 론리 문회 로에 2진신호로서 직 접 작용한다. 

여기서 다시 꺼내기주기를 통하여 조종장치가 어떻게 조종을 유지하는가를 보기 
로 하자. 조종장치는 꺼내기주기가 명령주기안의 어디에 있는가를 추적한다. 주어 진 
점 에서 꺼 내 기주기 가 다음에 수행되 게 된다는것을 찾아 낸다. 첫 단계는 PC 의 내 용을 
MAR 에 로 전송한다. 조종장치는 이 렇게 하기 위 하여 PC 의 비 트들과 MAR 의 비트普 
사이 의 문회 로를 여 는 조종신호를 능동으로 만든다. 다음단계 는 기 억 기 로부터 MBR 에 
로 자료를 읽 기 하며 PC 를 하나 증가시키 는것 이 다. 

•MAR 의 내용을 주소모선우에 태우기 위해 문회로들을 여는 조종신호 

• 조종모선 에 있 는 기 억 읽 기 조종신 호 

• 자료모선의 내 용을 MBR 에 기 억 시 키 기 위 해 문회 로들을 여 는 조종신호 

•PC 의 내용에 1 을 더 하여 그 결과를 다시 PC 에 기억시키는 론리조작을 하는 
조종 신호 


이 에 따라서 조종장치 는 MBR 와 m 사이 의 문회 로를 여 는 조종신호를 내 보낸 다. 

이 것 으로의 조종장치 는 간접주기든가 다음실 행주기 를 실 행하겠는가 하지 않겠는 
가를 결정해 야 하는것을 제외 하고는 꺼 내기주기를 완료한다. 이것을 결정 하기 위하여 
m 를 검 사하여 간접기 억참조가 이 루어 졌는가 아닌가를 식 별 한다. 

간접주기와 새치기주기도 이와 류사하게 동작한다. 실행주기인 경우 조종장치는 
조작코드에 대 한 검 사를 진행하며 그에 기 초하여 실 행주기기 간 어 느 마이 크로조작과 
정 을 수행하겠는가를 결정한다. 

3. 조종신호의 실례 

조종장치 의 기 능을 설명 하기 위 하여 간단한 실례 를 보기 로 하자. 그림 14-5 에 그 
실례를 주었다. 이것은 축적등록기가 하나인 간단한 처리장치에 대한 실례이다. 

부분들사이의 자료통로를 표시하고 있다. 조종장치로부터 출력되고 신호에 대한 
조종통로는 표시 하지 않았지 만 조종신호의 끝은 C , 라는 표식 을 붙이 고 동그라미 로 표 
시하였다. 조종장치는 박자신호와 명령등록기값，기발을 입구로 받아 들인다. 매 박자 
주기마다 조종장치는 이 입구값들을 전부 받아 조종신호를 만들어 내보낸다. 조종신호 
는 세곳으로 출구된다. 
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자료통로: 조종장치는 내부의 자료흐름을 조종한다. 례하면 명령을 꺼내는 경 
우 기억완충등록기의 내용은 명령등록기에로 전송된다. 매개 통로에 대한 조 
종은 문회로가 한다(그림에서 동그라미로 표시되여 있다). 조종장치로부터 
출구되는 조종신호는 자료가 통과하도록 문회로를 연다. 



그림 14 - 5. 자료통로들과 조종신호들 AC - 축적등록기 

• ALU (산수-론리연산장치): 조종장치는 조종신호들을 리용하여 ALU 에 대한 조 
작을 진행한다. 이 신호들은 ALU 내의 여 러개의 론리장치 들과 문회 로들을 능 
동으로 만든다. 

• 체계 모선 : 조종장치는 체 계 모선우의 조종신호선 례 하면 기 억 READ 신호에 조종 
신호를 내보낸다. 

조종장치는 명 령주기안에 있는 의미를 유지하고 있어 야 한다. 조종장치는 이 의미 
를 유지하면서 모든 입구신호를 받아 들여 마이크로조작이 진행되도록 일련의 조종신 
호를 출력한다. 박자임풀스를 리용하여 사건의 동작과정 을 동기 화하며 신호준위 의 안 
정화를 위하여 사건들사이의 동기화를 취한다. 표 14-1 은 앞에서 서술한 일부 마이크 
로조작과정 을 위하여 필요한 조종신호를 보여 주고 있다. 간단히 하기 위하여 PC 의 
내 용을 증가시키 며 PC 와 MAR 에 고정 된 주소들을 넣 기 위한 자료통로와 조종통로들 
은 표시하지 않았다. 

이것으로 조종장치의 최소한도의 성질을 가늠할수 있다. 조종장치는 전체 를퓨터 
를 동작시키 는 기 관이 라고 말할수 있다. 조종장치 는 실행된 명 령의 뜻과 산수-론리 연 
산결과의 상태(례하면 정의 값,자리넘 침)만을 안다. 조종장치는 처 리된 자료나 엄 어 
진 실제의 결과는 알지 못한다. 또한 조종장치는 처 리 장치 에 입 력되는 몇개의 조종신 
호와 체 계모선에 출력 되 는 몇개의 조종신호들을 가지 고 모든것을 조종한다. 
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표 14-1. 마이크로연산과 조종신호 


마이크로연산 

시 간 

능동조종신호 


ti: 

MAR *- (PC) 

c 2 


꺼내기 

t 2 : 

MBR 기 억 기 

C 5) 

Cr 

PC 

수 (PC) + 1 




던: 

IR — (MBR) 

c 4 



tl: 

MAR — (IR (주소)) 

Q 


간접 

h : 

MBR 기 억 기 

c 5 , 

Cr 


t3 ： 

IR (주소) — (MBR (주소)) 

c 4 



ti: 

MBR 七一 (PC) 

Cl 


새치기 

t2 ： 

PC 

MAR 보관주소 

ᅳ 루린주소 




t 3 * 

기억기 — (MBR) 

C 12 , 

Cw 

Cr - 

체계모선에로의 조종신호읽기 



C w - 

체계모선에로의 조종신호쓰기 




4. 처리장치의 내부구성 


그림 14-5 에 여 러개의 자료통로의 리용관계 
를 보여 주었다. 이러한 류형의 내부구성이 
복잡하리 라는것 은 명 백하다. 그림 11-2 에 서 
제 기한것 처 럼 몇종류의 내부모선배치 가 되 여 
있 다. 

처리장치의 내부모선을 리용하여 그림 14-5 는 
그림 14-6 에서 보여 준것처 럼 재배 치할수 있다. 
산수-론리연산장치와 처 리장치의 등록기들은 하 
나의 내부모선에 다같이 련결되여 있다. 문희로 
와 조종신호들은 매개 등록기로부터 모선에로의 
자료입출력을 조종한다. 보충된 조종신호들은 
체계 (외부)모선으로 나가거나 들어 오는 자료의 
전송과 산수-론리연산장치 에 대 한 조작을 조종 
한다. 

Y 와 Z 라는 표식 이 붙은 두개의 새 등록기 가 
내부구성에 더 포함되여 있다. 이것들은 산수- 
론리연산장치의 해 당한 조작을 위하여 필 요하다. 
두개 의 연산수가 포함된 연산을 수행할 때 하나 
는 내부모선으로부터 받지만 다른 하나는 다른 
원천으로부터 받게 된다. AC 는 목적주소를 위 
하여 리용되지만 이것이 체계의 유연성에 제한 
을 주며 여 러개의 일반목적등록기 를 가진 처 리 
장치처 럼 동작할수 없 다. 등록기 Y 는 다른 입 구 


없는 조합회 로이다. 따라서 조종신호가 ALU 의 
기능을 능동으로 할 때 ALU 에 가해 진 입력자 
료는 출력자료로 변환된다. 그런데 ALU 의 출구는 직접 모선에 련결될수 없는데 왜냐 



그림 14-6. 내부모선을 가진 CPU 
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출구가 입 구에 로 반결 합될수 있기 때 문이 다. 등록기 Z 는 림 시 출구기 억 기 로 
수행한다. 이 러 한 배 렬을 가지 면 기 억기 로부터 출력된 값을 AC 에 더하는 
과 같은 단계를 거친다. 

ti ： MAR— (IR (address)) 
t 2 ： MBRI— •기 억 기 
t 3 ： Y (MBR) 

t 4 ： Z 聲 . (AC) + (Y) 

t 5 ： AC «^'(Z) 

은구성을 다르게 할수도 있지만 일반적 으로는 몇 가지 종류의 내부모선에 
묵음이 리 용된다. 공통자료통로를 리용하면 내 부련결설계 와 처 리 장치 의 조 
할수 있 다. 내 부모선을 리용하는 다른 하나의 실 천적 의 의 는 공간을 절 약하 
특히 54 -inch 인 규소소편안에 넣어야 할 극소형처리장치에 대해서는 내 
나이의 련결을 위한 공간을 최 소화하여 야 한다. 

Intel 8085 


장에 서 소개 된 일 부 개 념 들을 설 명 하기 위 하여 Intel 8085에 대 하여 고찰« 
내 부구성 을 그림 14-7 에 보여 주었 다. 몇 가지 기 본요소들은 다음과 갈다. 










표 14-2. Intel 8085 외부신호 


주소와 자료선 r 


높은 주소 (A15-A8) 

16 bit 주소의 높은 자리 8 
주소/자료 (AD7-AD0) 

16 주소의 낮은 자리 8 혹은 8 자료. 이 다중화는 단자들에 보관한다. 

직렬입력자료 (SID) 

직렬로 전송하는 장치들에 알맞는 단일비트입력 (한번에 한비트) 

직렬 출력 자료 (SOD) 

직렬로 수신하는 장치들에 알맞는 단일비트출력 

박자 및 조종신호 

CLK(OUT) 

체 계박자. 매 주기 는 하나의 T 상태 를 표시한다. CLK 신호는 주변소편들에 공급되 여 박자 
를 일치시킨다. 

XI ， X2 

이 신호들은 외부수정편 혹은 내부박자발생기를 구동하는 다른 장치들에서 제공된다. 

주소빗장허가 (ALE) 

기 계 주기의 첫 박자상태동안 발생하여 주변소편들이 주소선들에 기 억 하도록 한다. 이것.. 
주소모듈(례하면 기억기， I 八))이 주소화되고 있다는것을 인식하게 한다. 

상태 (SO, S1) 

읽기 혹은 쓰기연산이 일어 나고 있는가를 가리키는데 리용되는 조종신호 

IO/M 

I/O 혹은 .기억기모듈의 읽기 및 쓰기연산에 리용 

읽기 조종 (RD) 

선택된 기억기 혹은 I 八)모듈을 읽거나 자료모선이 자료전송에 리용되고 있다는것을 지시 

쓰기 조종 (WD) 

자료모선상의 자료가 선택 된 기 억 기 혹은 I/O 위 치 에 써 넣 어 지 고 있다는것 을 지 시 

기억기 및 I/O 원시기호 

Hold 

資가 외부체 계 모선의 조종과 리 용을 포기 할것을 요구. CHJ 는 현재 頂 에 있는 명 령 실 
행을 끝내고 그다음 신호들이 CPU 에 의하여 조종，주소 혹은 자료모선에 삽입되지 않는 
동안 유지 상태 에 들어 간다. 유지 상래 동안 모선을 DMA 연산에 리 용할수도 있 다. 

Hold Acknowledge (HOLDA) 

이 조종장치 출력 신호는 HOLD 신호를 내 보내 여 현재 모선을 리 용할수 있 다는것 을 지 시 

READY 

보다 조속기 억 기 혹은 I/O 장치 를 가진 CPU 를 동기 화하는데 리용. 주소화된 장치 가 
READY 를 내 보내 면 CPU 는 입 구 ( DBIN ) 혹은 출구 ( WR ) 연산을 진행할수 있 다. 이 와 반 
대 이 면 CPU 는 장치 가 준비 될 때 까지 대 기 상태 에 들어 간다. 


TRAP 


새치기관련신호 


새치기재시동 (RST 7.5， 6.5， 5.5) 
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표 계속 


새치기요구 (INTR) 

이 4 개의 선들은 외부장치가 CPU 를 중단시키는데 리용된다. CPU 는 그것 이 유지상태 에 
있거나 새치기가 불가능하게 된 경우에는 새치기요구신호를 접수하지 않는다. 새치기는 명 
령실행때에만 접수된다. 이 새치기들은 낮은 순위의 우선권을 가전다. 

새치기응답 

새치기에 긍정응답한다. 

CPU 초기 화 

RESET IN 

PC 의 내용이 0으로 설정되게 한다. CPU 는 위치 0에서 실행을 재개한다. 

RESET OUT 

CPU 가 재설정되였음을 통보한다. 이 신호는 체계의 나머지부분을 재설정 하는데 리용될수 
있다 

전압과 접지 

VCC 

+5 V 전원공급 

VSS 

접지 


주소중가/감소빗장: 탄창지시기 혹은 프로그람계수기의 내용을 하나 증가 또는 
감소시킬수 있는 론리. 이것은 산수-론리연산장치를 리용하지 않으므로 시간을 
절약한다. 

새치기조종: 이 모둘은 여러개 준위의 새치기신호를 조종한다. 


• 직렬입출구조종: 이 모둘은 한번에 lbit 
씩 통신하는 장치와 결합된다. 


Xi C 

1 

40 

□ Vcc 

x 2 C 

2 

39 

□ HOLD 

Reset Out [ 

3 

38 

□ HLDA 

SOD Q 

4 

37 

] CLK (Out) 

SID Q 

5 

36 

□ Reset In 

Trap ᄃ 

6 

35 

□ Ready 

RST7.5 □ 

7 

34 

] IO/M 

RST6.5 [ 

8 

33 

□ Si 

RST5.5 [ 

9 

32 

□ RD 

INTR [ 

10 

31 

□ WR 

INTA □ 

11 

30 

□ ALE 

AD 0 ᄃ 

12 

29 

□ S 0 

AD, [ 

13 

28 

=1 a 15 

ad 2 [ 

14 

27 

그 Ai4 

ad 3 [ 

15 

26 

□ Ai 3 

ad 4 ᄃ 

16 

25 

□ a 12 

ad 5 [ 

17 

24 

그 An 

ad 6 c 

18 

23 

그 A 10 

ad 7 c 

19 

22 

Z1 a 9 

Vss C 

20 

21 

□ a 8 


표 14-2 는 8085 에 입 출력 되 는 외 부신 
호를 서술한것이다. 이 신호들은 외부체계 
모선과 련결된다. 또한 8085 처 리 장치와 체 
계 의 나머 지구성 요소들과의 결 합을 한다 
(그림 14-8). 

조종장치는 두가지 요소로 되여 있는 
데 하나는 명 령해 신기와 기계주기부호화모 
둘이고 다른 하나는 동기 및 조종모둘이다. 
첫번째 모둘에 대 한 론의는 다음절에서 한 
다. 조종장치에서 기본은 동기 및 조종모둘 
이다. 이 모둘은 박자신호를 포함하여 현행 
명령과 일부 외부조종신호들을 입구로 한 
다. 그의 출구는 처 리 장치내 부의 다른 요소 
들에 가해 지 는 조종신호와 외 부체 계모선 
에 출력되는 조종신호로 이루어 져 있다. 

처 리 장치 의 조작을 위한 동기 는 박자 
신호에 의하여 진행 되 며 조종장치 에 의하 


그림 14-8. Intel 8085 단자배 치 
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여 조종된다. 매 개 명 령 주기 는 1~5 까지 의 기 계 주기 들로 이 루어 지 며 매 개 기 계 주기 는 
또한 3-5 개의 상태주기로 되여 있다. 매개 상태주기는 한박자주기동안 지속된다. 이 
기 간 처 리 장치 는 조종신호에 의하여 정 해 진대 로 하나 혹은 몇개의 마이 크로연산을 
동시 에 수행 한다. 

기계주기의 수는 주어 진 명령에 대하여 고정되여 있다. 기계주기는 모선호출과 
등가적으로 정의되여 있다. 따라서 명령에 대한 기계주기의 수는 처리장치가 외부장치 
와 통신하는 회수에 의존한다. 례를 들어 명령이 두개의 8bit 부분으로 구성되여 있다 
면 그때 두 기계주기는 명령을 꺼내는데 쓰인다. 그 명령이 lbyte 의 기억기나 입출구 
조작인 경우 세번째 기계주기는 실행을 위한것이다. 

그림 14-9 는 8085의 동기실례 를 주었는데 외부조종신호의 값을 보여 준다. 물 
론 갈은 시간에 내부조종신호들은 내부자료전송을 조종하기 위하여 조종장치에서 
발생된다. 시간선도는 OUT 명령에 대한 명령주기를 보여 주고 있다. 기계주기 
( MbMiMu ) 에는 3개의 주기 가 요구된다. 첫 Ml 기 간에는 OUT 명 령을 꺼 낸다. 두 
번째 기계주기에는 명령의 절반을 꺼내는데 여기에는 출력하려는 입출력장치의 번 
호가 들어 있다. AC 의 내 용은 세번째 주기기 간에 자료모선을 통하여 선택 된 장치 
에 써넣어 지게 된다. 
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그림 14-9. 시 간도형 을 표시 한 Intel 8085 OUT 처 리 장치 

매 기 계주기 의 시 작은 조종장치 로부터 출력 된 주소빗 장가능신호 ( ALE ) 가 알려 
준다. 기계주기 Mi 의 동기상태 刀기간 조종장치는 이것이 기억조작이라는것을 알 
려 주는 IO/M 신호를 설정 한다. 또한 조종장치 는 PC 의 내 용이 주소모선 ( A 15 _ A 8 ) 
과 주소-자료모선 ( AD 7 - ADo ) 에 출력되 게 한다. 임풀스의 내 림 면에 서 모선에 련결 
된 다른 모둘들은 주소를 기 억한다. 
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동기상태 t 2 기간 주소가 지적된 모둘은 지적된 기억주소의 내용을 주소-자료모선 
에 태 운다. 이 때 조종장치 는 읽 기 상태 를 의 미하는 읽 기 조종신호 ( RD ) 를 설정한다. 그 
러 나 T 3 기 간에는 자료를 주소모선으로부터 복사하기 위하여 대기한다. 이것은 모선우 
에 자료를 태 우거 나 신호준위 를 안정시 키 기 위한 여 유시 간을 준다. 마지 막상태 인 
T 4 는 처 리 장치 가 명 령을 해 신하는 기 간으로서 모선무효상태 (모선을 리용하지 않는 
상태) 이다. 나머지 기계 주기도 동작방식이 류사하다. 

제 3 절. 장치적실현 

지금까지 입구와 출구,기능의 견지에서 조종장치를 론의하였다. 

여기서는 조종장치를 실현하는 문제에 대하여 고찰한다. 이를 위하여 여러가지 수 
법들이 리용되였는데 이들의 대부분은 아래의 두가지 실현방법가운데서 어느 한가지 
를 택하고 있다. 

• 장치배선론리실현 

• 마이크로프로그람실현 

장치배선론리로 실현하는 조종장치는 본질에 있어서 조합회로이 다. 조종신호는 
그의 입구론리신호들읖 출구론리신호로 변환한다. 이에 대한 기초를 이 절에서 취 
급하며 마이 크로실 현은 제 15장에 서 론의하기 로 한다. 

1. 조종장치입구 

그림 14-4 는 지금까지 론의해 온 조종장치를 보여 주었다. 여기에서 주요입력은 
명 령 등록기 내 용，박자신호, 상태 기발들과 조종모선신호들이 다. 상태 기발들과 조종모선 
신호들인 경 우에 매 개 개 별비 트들은 자기의 고유한 의 미를 가진다(례하면 자리넘 침). 
그런데 다른 두개의 입구는 조종장치에 직접 리용할수 없다. 

먼저 명 령등록기 에 대 하여 고찰해 보자. 조종장치 는 조작코드를 받아 서 로 다 
른 명 령에 대하여 서로 다른 동작(서 로 다른 조종신호의 조합을 출력)을 수행한다. 
조종장치 의 론리 를 간단히 하기 위 하여 서 는 매 개 조작코드에 대 하여 단일 론리입 구 
가 있 어 야 한다. 이 기 능은 해 신기 에 의하여 수행 되 며 해 신기 는 입 구를 부호화하여 
하나의 출력 신호를 만든다. 일 반적 으로 해 신기 는 n 개의 2 진입구와 2 n 개의 출구로 
되 여 있다. 2 n 개의 서로 다른 개개의 입력패턴은 오직 하나의 출구만을 능동으로 
만든다. 표 14-3 이 그 실례 이 다. 조종장치 를 위한 해 신기 는 가변길 이조작코드들을 
고려해 야 하므로 이 보다 더 복잡하게 된다. 해 신기 를 실 현하는데 리용한 수자론리 
의 실례를 부록 I 에 주었다. 

조종장치의 박자부분은 련속적인 임풀스를 반복적으로 내보낸다. 이것은 마이 
크로조작의 지속과정을 측정하는데 리용한다. 박자임풀스의 주기는 자료통로를 따 
라서 그리고 처리장치의 회로를 통하여 신호가 전파될수 있도록 충분히 길어야 한 
다. 그런데 조종장치 는 하나의 명 령주기내 에 조종신호들을 서 로 다른 시 간단위 로 
출력한다. 따라서 T x > T 2 등 기 간에 리용되 는 서 로 다른 조종신호가 있 으면 조종장 
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치 에 가해 지는 입구로서는 계수기 가 좋을것 이 다. 명 령주기의 
에서 다시 계수기를 초기화하기 위하여 여기에 반결합을 : 
이 두가지 구분에 기초하여 조종장치는 그림 14-10 에서처 럼 

2. 조종장치론리 

조종장치에 대한 장치배선론리실현을 정의하기 위하여 아래 
에 따라 출력조종신호를 만드는 조종장치의 내부론리에 대하여 
중요한것은 매개 조종신호에 대하여 진행해야 할것은 그 신 
능에 따라 유도하는것이다. 이것은 실례를 들어 설명할수 있다. 
간단한 실례를 다시 고찰해 보자. 표 14-1 에 명령주기의 4 개의 
필요한 마이크로조작과정과 조종신호들을 보여 주었다. 

조종신호 (： 5 를 보기로 하자. 이 신호는 외부자료모선으로복 
읽 기 위 한것 이 다. 이 것 은 표 14-1 에 서 두번 리 용된 다는것 을 알주 
조종신호 P 와 Q 를 정의 하자. 여기서 P 와 Q 는 다음과 갈은 곡 

PQ = 00 꺼 내 기 주기 

PQ = 01 간접 주기 

PQ = 10 실행주기 

PQ = 11 새 치 기 

그래서 Q 는 다음과 갈은 론리식으로 정의된다. 

c 5 =pqt 2 +pqt 2 

조종신호 (그는 꺼내기와 간접의 두주기의 두번째 시간동안 유지 










에서 고찰한다. 


참고문헌 

[WARD9()] 과 [MAN09 기을 비롯한 일련의 참고문헌들에서 조종장치기능에 대한 
기본원리를 취급하고 있다. 

MAN097 Mano , M. Logic and Design Funder men. Upper Saddle River, NJ ： 
Prentice Hall, 1997 

WARD90 Ward, S., and Halstead, R. Computation Structures. Cambridge, MA ： 
MIT Press, 1990 


련습문제 

1. ALU 는 두개의 입력등록기를 더할수 있고 또 두 입력등록기의 비트들을 론리 
적으로 보수를 취할수 있는 가능이 있다고 하자. 그러나 덜기는 할수 없다. 수 
들은 2 의 보수형 태 로 기 억된다. 조종장치 가 덜기를 수행 하기 위한 마이크로연 
산을 표로 작성하시오. 

2. 다음의 명 령 들을 그림 14-5 에 있는 처 리 장치 에 대 한 표 14-1 과 같은 형 식 으로 
마이 크로조작과 조종신호들을 표시하시 오 . 

• 축적 등록기 넣 기， 

• 축적 등록기 쓰기 , 

• 축적 등록기 더 하기， 

• 축적등록기론리곱하기， 

•이행, 

• AC = 0 이 면 이 행， 

• 죽적 등록기 보수 

3. 그림 14-6 의 모선과 산수-론리연산장치 를 통한 전달지 연이 각각 20, 100 ns 라고 
하자. 등록기 가 모선으로부터 자료를 복사하는데 필요한 시간은 10 ns 이 다. 다 
음의 경우에 요구되여 야 할 시간은 얼마인가? 

1. 자료를 한 등록기 로부터 다른 등록기 로 전송하는데 요구되는 시 간 

L. 프로그람계 수기 를 증가시키 는데 요구되 는 시 간 

4. 수가 다음과 같을 때 AC 에 수를 더 하기 위 하여 그림 14-6 의 모선구조가 요구 
하는 마이 크로조작과정 을 작성 하시 오. 

1. 즉시연산수， 

L. 직 접주소연산수, 

1 그 . 간접주소연산수 

5. 탄창이 그림 9-14 에 보여 준것 처 럼 되 여 있 다. 다음의 경 우에 대 하여 마이 크로 
조작과정을 작성하시오. 

1. 탄창에서 꺼내기 

l . 탄창에 넣 기 
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제 15 장. 마이크로프로그람조종 



신호 신호 


♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦ 

♦ 장치배선론리식조종장치실현의 또 한가지 방법은 조종장치의 론리가 마이크로프 
로그람에 의 하여 규정 되 는 마이 크로프로그람조종장치 이 다. 마이 크로프로그람은 마 
이 크로프로그람작성 언어 로 표시된 명 령 렬로 구성되 여 있다. 

♦ 마이 크로프로그람조종장치 는 마이 크로명 령 에 의 하여 동작순서 를 결정 할수 있으며 
매개 마이크로명령을 실행하여 조종신호를 발생시킬수 있는 상대적으로 간단한 
론리 회로이 다. 

♦ 장치 배 선론리 식 조종장치 에서 와 같이 마이 크로명 령 에 의 하여 발생 된 조종신호는 
등록기 전송과 ALU 조작을 하는데 쓰인다. 

♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦ 
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마이크로프로그람이 라는 말은 1950 년대 초에 월크스 ( M . V . Wilkes ) 에 의하여 처음으 
로 제 안되 였 다 [ WILK 51]. 월 크스는 조종장치 를 구성 하고 체 계 화하여 장치 배 선론리 실현의 
복잡성 을 피할수 있는 설계방안을 제 기하였 다. 이 착상은 많은 전문가들의 흥미 를 끌었 
으나 실현할수 없는 문제가 있었다. 그것은 고속이면서 상대적으로 값이 비싼 조종기억 
기가 필요했기때문이 다. 

마이 크로프로그람기술의 이 문제는 1964 년 2 월에 나온 자동자료처 리 에 의하여 다시 
고찰되 였다. 그 시 기 에는 비 마이 크로프로그람체계 가 광범히 리 용되 였으며 당시 론문들가 
운데서 하나의 론문인 [ HILL 64] 에서는 마이크로프로그람의 미래에는〈〈얼마간 구름이 끼 
여 있다. 생각하건데 마이크로프로그람작성자들 모두가 이에 대하여 연구하고 있다고 하 
더 라도 그들중 누구도 그 기술에 흥미를 가지지 못하였다.》라는 전문가들의 견해를 종합 
하여 발표하였다. 

이러한 사실은 바로 몇 달후에 극적인 변화를 가져 왔다. IBM System /360 이 그해 봄 
에 나왔는데 제일 큰 모둘은 마이크로프로그람화되였다. 비록 360 계렬이 반도체 ROM 의 
기 능을 훨씬 앞섰지만 마이 크로프로그람의 우점 을 고려하여 IBM 은 이 것 을 받아 들이였 
다.그중의 하나가 처 리 장치 의 조종장치 를 마이 크로프로그람으로 실 현한것 이 다. 

제 1 절. 기본개념 


1. 마이크로명령 

조종장치 는 합리 적 으로 간단한 장치처 럼 보인 다. 그러 나 기본론리 요소들을 호상 련 
결하여 조종장치를 실현하는것은 그리 쉬운 일이 아니다. 그 설계에는 마이크로조작순서 
를위한 론리，마이크로조작을 실행하기 위한 론리，조작코드를 해석하기 위한 론리， 
ALU 의 기발에 기초한 결심채택을 위한 론리가 포함되여 있어야 한다. 이러한 하드웨어 
부분을 설계하고 검사하는것은 어려운 문제이다. 더우기 설계는 상대적으로 변경시키기 
어 렵 다. 례하면 새 로운 기계명 령을 더 보충하려 고 하는 경우에 설계의 변경 이 힘들다. 

현대 CISC 처 리 장치 에 서 흔히 공통으로 리용되 는 방안은 조종장치 의 마이 크로프로그 
람화를 실현하는것 이 다. 

표 14-1 을 다시 고찰해 보자. 조종신호를 리용하는 외 에 매 개 마이 크로조작은 기 호 
로 서술된다. 이 기 호는 마치도 프로그람작성언어와 같다고 볼수 있다. 이것 이 바로 마이 
크로프로그람작성언어 이 다. 매 개 행 은 한번에 수행할 마이 크로조작들을 서 술한것 이 며 일 
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명 마이크로명령이라고 한다. 이 명령렬을 마이크로프로그람 혹은 험웨어라고 한다. 험웨 
어 라는 말은 마이 크로프로그람이 하드웨 어와 쏘프트웨 어의 중간에 놓인다는데 로부터 붙 
여 진것이다. 하드웨어보다 험웨어를 설계하는것은 더 쉽지만 험웨어프로그람은 쏘프트 
웨 어프로그람보다 작성하기가 더 힘들다. 

마이크로프로그람의 개념을 조종장치를 실현하는데서 어떻게 리용할수 있는가? 매 
개 마이크로조작에 대한 개념과 조종장치에서 조종신호를 어떻게 발생시키는가를 고찰 




그림 15-1. 전형적인 마이크로명령형식 
T - 수평마이 크로명 령，수직마이 크로명 령 


해 보자. 임의의 마이크로조작에 대하여 조종장치로부터 나오는 매개 조종신호선은 설 
정 ( ON ) 이나 차단 ( OFF ) 상태에 있다. 이 조건은 물론 매개 조종선을 2 진수로 표현할수 
있게 한다. 그러 므로 매 비 트가 하나의 조종선을 의 미하는 조종단어 를 구성할수 있 다. 
따라서 매 개 마이 크로조작은 1과 0들의 서 로 다른 패 턴에 의하여 조종단어 로 표현할수 
있 다. 

조종장치 에 의하여 수행 되 는 마이 크로조작과정 을 표현 하는 조종단어 의 렬 을 가정 하 
여 보자. 여기서 우리는 마이크로조작과정이 고정되여 있지 않다는것을 알아야 한다. 때 
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때로 간접주기가 있는 경우도 있고 없는 경우도 있으므로 조종단어를 기억기에 넣고 매 
개 단어에 유일주소를 할당한다. 그다음 매개 조종단어에 주소마당을 덧붙이고 이 주소 
가 일정한 조건이 참이면(례하면 기억기참조명령에서 간접이든가 1 이면) 집행될 다음조 
종단어의 위치를 지적하게 한다. 그외에 조건을 규정하기 위하여 몇개의 비트를 더 첨부 
한다. 

이렇게 얻 어 진 결과가 수평마이크로명 령이며 그 실례를 그림 15-1 에서 보여 주었 
다. 마이크로명 령 혹은 조종단어의 형식은 다음과 같다. lbit 는 매 개 내부처 리 장치조종선 
을 위한것 이 며 다음 lbit 는 매 개 체 계 모선조종선을 위한것 이 다. 조건마당은 분기 가 있거 
나 분기가 없는 경우에 다음에 집행할 마이크로명 령의 주소를 가진 마당이 있다는것을 
지적한다. 이러한 마이크로명령은 다음과 같이 해석된다. 

1. 이 마이 크로명 령 을 실행 하기 위하여 lbit 로 지적된 조종선#은 모두 설정하며 
Obit 로 지적된 조종선들은 모두 차단한다. 그 결과 조종신호들은 하나 혹은 여러 
개의 마이크로조작이 수행되게 한다. 

2. 조건비트에 의하여 지적된 조건이 거짓이면 차례로 다음마이크로명령을 실행한다. 

3. 조건비 트에 의하여 지 적된 조건이 참이 면 실행하려 는 다음마이 크로명 령 이 주소마 
당에 의하여 지 적된다. 

그림 15-2 에 조종단어 혹은 마이크로명 령 들이 조종기억 기 안에 어 떻게 배 렬되 는가를 
보여 주었다. 매개 보조프로그람안의 마이크로명령들은 순서대로 실행된다. 매개 보조프 
로그람은 다음에 어디로 가야 하는가를 지적하는 분기 및 이행명령으로 끝난다. 여기에 
특수한 실행주기보조루린이 있는데 그 목적은 기계명 령보조루린 (AND, ADD 등)가운데서 
어 느 하나만을 현재조작코드에 따라 다음에 집 행하였 는가 하는것 을 표시 하자는데 있 다. 

그림 15-2 의 조종기억기는 조종장치의 완료조작을 간단히 보여 준다. 이것은 매 
개 주기 (꺼내기, 간접，실행，새치기)기간 수행되여야 할 마이크로조작과정을 정의하 
며 이 주기 들의 순차를 정한다. 이 표기 는 일부 콤퓨터 에 쓰일 조종장치 의 기 능을 증 
명 하기 위한 표기 법 이 다. 실제 는 이 보다 더 많다. 다음으로 조종장치실현방법 에 대 하 
여 보기로 하자. 

2. 마이 크로프로그람조종장치 

그림 15-2 의 조종기억기 에는 조종장치의 동작을 서술한 프로그람이 들어 있다. 이 
프로그람을 간단히 실행시키는것으로 조종장치를 실현할수 있다. 
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* 'IOF 루틴 

꺼내기 ᄈ 새치기에로의 이행 


그림 15-2. 조종기억기의 구성 
종장치의 기능은 다음과 갈다. 


그림 15-3 은 이 실현을 위한 기 본요 
소들을 보여 주었다. 마이크로명 령들은 
조종기억 기 안에 기 억 되 여 있 다. 조종주 
소등록기 에는 읽 어 들여 야 할 다음 마 
이크로명 령의 주소가 들어 있다. 마이크 
로명령은 조종기억기로부터 읽어져 조 
종완충등록기에로 전송된다. 이 등록기 
의 왼쪽 부분(그림 15-1 1) 은 조종장치 
로부터 나오는 조종신호선과 련결된다. 
따라서 조종기억기로부터 마이크로명령 
의 읽기는 그 마이 크로명 령 을 실행하는 
것과 같다. 그림 에서 보여 준 세 번째 요 
소는 조종주소등록기를 읽 어 읽기지 령 
을 출구하는 순서 장치 이 다. 

그림 15-4 에 보여 준것처 럼 이 구조 
를 좀 더 구체적으로 살펴 보자. 그림 
14-4 와 비교해 보면 조종장치는 여전히 
같은 입 구 ( IR , ALU , 상태 기발, 박자) 들 
과 출구(조종신호)들을 가지고 있다. 조 


1. 명령을 실행하기 위하여 순서론리장치는 READ 지령을 조종기억기에 줄력한다. 

2. 그의 주소가 조종주소등록기 에 규정되 여 있는 단어를 조종완충등록기 에서 읽는 
다. 

3. 조종완충등록기 의 내 용은 순서 론리 장치 에 대 하여 조종신호와 다음주소정보를 발 
생 시 킨다. 

4. 순서 론리장치 는 조종완충등록기 와 ALU 기 발들로부터 나오는 다음주소정 보에 따라 
서 조종주소등록기에 새 주소를 넣는다. 

이 모든것은 한박자동안에 진행된다. 

마지막단계를 잘 처리하는것 이 펼요하다. 매개 마이크로명 령의 끝에서 순서론리장치 
는 조종주소등록기 에 새 주소를 넣 는다. ALU 기 발들과 조종완충등록기 의 값에 따라 아래 
의 세 가지 가운데서 어느 한가지 결론을 얻을수 있다. 


&접 은 실행에로의 이행 


꺼내기에로의 이행 


조작 a 드루린에로의 이행 


꺼내기 훅^ 새치기에로으 I 이행 


꺼내기 훅은 새치기에로의 이행 


내기린 접기린 치기린 행작 
꺼 K - T - 루 간 주 루 새 주루 실시 


494 












• 다음명 령 꺼내기 : 조종주소등록기 에 1 을 더 한다. 

• 이행명령에 따라서 새로운 보조프로그람에로 이행: 조종완충등록기의 주소마당을 
조종주소등록기에 넣는다. 

• 기계 명 령 보조프로그람에 로 이행 : m 안의 

조작코드에 따라서 조종완충등록기에 넣 
는다. 

그림 15-4 는 해신기 라는 표식이 붙은 두 
개의 모둘을 보여 준다. 우에 있는 해신기는 
班 의 조작코드를 조종기억 주소로 변환한다. 아 
래 의 해 신기는 수평마이크로명 령 에서는 쓰지 
않지만 수직마이크로 명령에서는 쓰인다(그림 
15-1 L ). 우에서 언급된것처 럼 수평마이크로 
명령에서 조종마당안의 매개 비트는 조종선에 
련결된다. 수직마이크로명령에서 코드는 수행 
되여야 할 매개 동작을 규정하는데 리용되며 
(례하면 MAR ᅳ (PC)) 해 신기 는 이 코드를 개 
별적 인 조종신호로 변환한다. 수직마이크로명 
령 의 우점 은 수평마이 크로명 령보다 비 트수가 훨씬 적 다는것 이 다. 

3. 월크스조종 

앞에서 언급된 바와 같이 월크스는 1951 년에 처음으로 마이크로프로그람조종의 리용 
을 제안하였다 [ WILK 51]. 이 제안은 보다 더 구체적인 설계에로 발전하였다 [ WILK 53]. 
이 초기의 제안을 고찰해 보는것이 펼요하다. 

월크스에 의 하여 제 안된 구성 을 그림 15-5 에 주었다. 이 체 계 에서 핵은 2극소자들로 
구성된 행렬이다. 기계주기기간에 2 극소자행렬의 한개 렬이 임풀스에 의하여 능동으로 
된다. 이것은 2극소자가 있는 곳에서 신호를 발생시 킨다(그림 에서 점 으로 표시된 부분) . 
렬의 첫 부분은 처리장치의 동작을 조종하는 조종신호를 만든다. 두번째 부분은 다음 기 
계 주기 에서 동기될 렬의 주소를 발생시킨다. 따라서 행 렬의 매 개 렬은 하나의 마이 크로 
명 령 에 대 응하며 행 렬 의 배 렬 은 조종기 억 기 기 능을 수행 한다. 

박자의 시 작에 서 임풀스가 가해 진 렬의 주소는 등록기 I 에 들어 간다. 이 주소는 
다시 해신기에 입구되며 박자임풀스에 의하여 능동이 되면 대응하는 행렬에서 하나의 렬 


TtT~\ 1 조종주소등록기ᄀ 

론리 


읽 기 


그림 15-3. 조종장치의 마이크로 
구성 방식 
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을 능동으로 만든다. 조종신호에 따라서 명령등록기 안의 조작코드라든가 임풀스가 가해 
진 렬의 두번째 부분이 주기기간 등록기 II 를 통과한다. 그다음 등록기 II 는 박자임풀스 



CPU 내 부의 체 계 모선 에 

조종보호 출력되는 조종신호 


그림 15-4. 마이 크로프로그람조종장치 의 기 능 

에 의하여 등록기 I 에 입 구된다. 박자임풀스가 계 속 가해 짐 에 따라 행 렬의 렬 이 능동으 
로 되며 등록기 II 로부터 등록기 I 에로 전송이 실현된다. 해신기가 조합회로이므로 두 등 
륵기 배 렬 이 요구되 며 한 등록기 만을 가지 면 비 안정 조건 이 생 겨 출구가 박자주기 기 간 입 
구로 되게 된다. 이것은 그림 15-1 가에서 보여 준 수평마이크로프로그람방식과 매우 류 
사하다. 기본차이는 선행한 서술에서는 조종주소등록기가 다음주소를 만들기 위하여 하 
나만큼 증가된다는것 이 다. 월크스방법 에서는 다음주소가 마이크로명 령 안에 포함되 여 있 
다. 분기하기 위하여 렬에는 그림에서 보여 준것처 럼 조건신호(례하면 기발)에 의하여 
조종되는 두개 주소가 있어야 한다. 
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표 15-1. 월크스의 기계명령모임실례 


순서 


기능 

An 

Accl<- C(Acc) + C(n) 


Sn 

Accl<- C(Acc) - C(n) 


Hn 

Acc2<— C(n) 


Vn 

Acc C(Acc2) X C(n), 

여기서 C(n)^ 0 

Tn 

n — C(Accl), Acc 公 


Un 

n <_ C(Accl) 


Rn 

Acc <- C(Acc) X 2 ■ (nH 

-1) 

Ln 

Acc <- C(Acc) X 2 n+1 


Gn 

C(Acc) < 0 이 면 n ■卜 

흐름조종, C(Acc)^ 0 이면 무시 

In 

입구기구에서 다음문자를 « 으로 읽기 

On 

줄구기 구 C(n) 


주의: 

Acc = 축적기 



Acc ] = 축적기의 웃자리절반 
고 cc2 = 축적기의 아래자리절반 
n = 기억 주소 n 

C ( X ) = X의 내용 (X- 등록기 혹은 기억기주소) 


더하기명령에 대한 조작코드(시가 나타나면 5 번째 위치에 있는 마이크로명령이 실행된다. 
2 행과 3 행은 ALU 와 조종장치에 의하여 취해 지는 동작을 표시한다. 매개 기호표현은 조 
종신호(마이크로명령비트들)로 변환되여야 한다. 4행과 5행은 두개의 기발(방아쇠)들을 설 
정하고 리용하여야 한다. 4 행은 기발을 설정하는 신호를 규정한다. 례하면 어는 기발번호 
1 이 등록기 안에 있는 수의 부호비트에 의하여 설정된다는것을 의미한다. 만일 5행에 기발 
식별자가 있으면 그때 6 행과 7 행에는 리용해야 할 두개의 서로 다른 마이크로명령주소가 
들어 있다. 다른 한편 6행은 꺼내야 할 다음 마이크로명령의 주소를 규정한다. 

명령 0〜4 는 꺼내기주기를 이룬다. 마이크로명령 4 는 해신기에 조작코드를 넣어 꺼 
내 려고 하는 기계명 령 에 대응하는 마이크로명 령의 주소를 발생시킨다. 표 15-2 를 주의 
깊게 연구하면 조종장치의 완전한 기능을 알수 있다. 

표 15-2. 월크스의 마이크로명령실례 

주의 : 在 s, C,...... 등은 산수연산 및 조종등록기장치의 각이한 등록기들을 의미한다. c 라는것은 스위치회로들 

이 C • 등록기 의 출구를 입 구등록기 Z) 에 련결 시 켰 다는것 을 의 미 한다. C—0) ■匕 4) 라는것 은 义 등록기 의 출구가 가산장치 
(여기서 D 의 출구는 다른 입구들에 련결되였다.)의 한 입구에 련결되였으며 가산기의 출구가 C 등록기에 련결되였다 
는것을 의미한다. 인용문안의 수자기호 n 는 아래자리수자의 단위중에서 출구가 n 번째인 원천을 의미한다. 



산수연산부 

조종등록기부 

조건적방아쇠 

다음마이크로명령 




설정 | 리용 

0 1 

0 


G，E — F 

一 1 

1 
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우점과 결함 


L 종장치의 실현에 마이크로프로그람을 리용하면 조종장치의 설계를 간단히 할수 있 
리적인 우점이 생긴다. 즉 설계를 보다 값 눅게, 보다 오유가 적게 실현할수 있다. 
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하드웨 어 배 선론리 식 조종장치 는 많은 명 령 주기 를 가지 는 마이 크로조작을 통하여 순서 를 
짜야 하므로 론리가 복잡해 진다. 반대로 마이크로프로그람조종장치의 해신기들과 순서 
론리장치는 론리가 대 단히 간단하다. 

마이 크로프로그람장치 의 기 본결 함은 하드웨 어 배 선론리 장치 보다 속도가 뜬것 이 다. 그 
럼에도 불구하고 마이크로프로그람은 실현이 쉽기때문에 현대 CISC 조종장치실현에서 지 
배적인 기술로 되고 있다. 보다 더 단순한 형식을 가진 RISC 처리장치들은 대표적으로 하 
드웨 어배선론리조종장치를 리용하고 있다. 이 것을 통하여 마이 크로프로그람방식 에 대 한 
보다 더 구체적 인 리해를 가질수 있다. 

제 2 절. 마이크로명령순서화 

마이크로프로그람조종장치 에 의 하여 수행되 여 야 할 두가지 과제는 다음과 같다. 

• 마이크로명령 순서화: 조종기 억 기로부터 다음마이크로명령을 꺼낸다. 

• 마이크로명 령실행 : 마이크로명령실행 에 필요한 조종신호를 발생시 킨다. 

조종장치를 설계 함에 있어서 이 두 과제는 함께 고려되 여 야 하는데 그것은 마이크로 
명령의 형식과 조종장치의 동기에 영향을 미치기때문이다.이 절에서는 순서화를 위주로 
설 명 하고 형식 화와 동기 에 대 한 문제 는 될수록 적게 론의 한다. 

1. 설계에서 고려할 점 

마이크로명령순서화기술의 설계에서는 두가지 문제를 고려해야 하는데 하나는 명령 
의 크기이고 다른 하나는 주소발생시간이다. 첫번째 문제는 조종기억기의 크기를 최소화 
하여 그 부분가격을 줄이자는것이며 두번째 문제는 될수록 마이크로명령이 빨리 실행되 
게 하자는것이다. 

마이크로프로그람실행 에서 실행 해 야 할 다음마이 크로명 령의 주소는 아래의 분류가운 
데서 어느 하나에 의하여 엄 어 진다. 

• 명령등록기에 의하여 결정되는것 

• 다음주소 

• 분기 

첫번째것은 명령꺼내기를 한 다음 명령주기당 한번만 생긴다. 두번째것은 대부분의 
설계에서 가장 공통적인것이다. 그러나 순차호출인 경우 최적화할수 없다. 조건 및 무조 
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건명 령 에 따르는 분기 는 마이 크로프로그람에서 필수적 인 부분이 다. 더 우기 마이 크로명 령 
순서는 짧은것이 특징인데 3〜4 개의 마이크로명령마다 하나의 분기가 있다 [ SIEW 82]. 따 
라서 집 약화되 고 시 간효률이 높은 마이 크로명 령 분기 를 위한 기 술이 중요하다. 


2. 순서화기술 


현재 의 마이 크로명 령，조건기 발과 명 령 등록기 의 내 용에 기 초하여 다음마이 크로명 령 
에 대하여 조종기억주소를 발생시켜야 한다. 이를 위하여 여러가지 기술이 리용되였다. 
이 기 술들은 그림 15-6 부터 그림 15-8 에 서 제 시 한것 처 럼 3 가지 일 반적 인 부류로 나눌수 
있다. 이 마이크로명령안의 주소정보의 형식에 기초하여 이것을 분류하였다. 

• 두개 주소마당 

• 하나의 주소마당 

• 가변형식화 

제 일 간단한 방법은 매개 마이크로명령에 두개 주소마당을 할당하는것이다. 그림 



|명 령4록기 | 

그림 15-6. 분기조종론리 , 2개의 주소구역 


15-6 에 이 정보가 어떻게 리용되는가를 
보여 주었 다. 다중선택기 는 주소마당과 
명 령등록기내 용을 더하여 목적주소를 얻 
기 위하여 리 용된다. 주소선택입 구에 따 
라서 다중선택기는 조작코드라든가 두개 
의 주소가운데서 하나를 조종주소등록기 
(CAR) 에 전송한다. 계 속하여 CAR 는 
해 신되 여 다음의 마이 크로명 령주소를 만 
든다. 주소선택신호는 분기 론리모둘에 
의하여 제 공되 는데 분기 론리모둘의 입 구 
는 조종장치기발들과 마이크로명 령의 조 
종부에서 나오는 비트들로 되여 있다. 

두 주소방식은 비록 간단하지만 다 
른 방식에 비하여 마이크로명 령의 길이 
가 긴것 이 다. 일부 론리를 보충하여 이 
것 을 절 약할수 있다. 흔히 쓰이 는 방식 
은 하나의 주소마당방식 이 다(그림 15-7). 
이 방식을 리용하여 다음주소에 대한 선 
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택을 다음과 같이 한다. 

• 주소마당 

• 명령등록기해신 

• 다음순차주소 

주소선택신호들은 어 느것 이 
선택되였는가를 결정한다. 이 방식 
은 주소마당의 수를 하나로 줄인 
다. 그런데 참고해야 할것은 일반 
적으로 주소마당은 리용되지 않는 
다는것이다. 따라서 마이크로명령 
에 대한 코드화에서 일부 비효과 
적인것이 있다. 

또 다른 방식은 완전히 서로 
다른 두개의 마이크로명령형식(그 
림 5-8) 을 제기하고 있다. 한비트 
는 형 식 화가 리용되 고 있 다는것 을 
지적한다. 어떤 형식화에서 나머지비트들은 조종신호를 능동으로 하는데 쓰인다. 다른 형 
식 화에 서 일부 비 트들은 분기모둘론리 를 조종하며 나머 지비 트들은 주소를 제 공한다. 첫 
번째 형 식 화에 서 다음주소는 다음순차주소라든가 명 령등록기 로부터 나온 주소이 다. 두번 
째 형식화에서 조건분기나 무조건분기가 결정된다. 이 방식의 한가지 결함은 개개의 분 
기명령실행에 옹근 하나의 주기가 소비되는것이다. 다른 방식들에서 주소발생은 조종기 
억 호출을 최 소화하기 위하여 조종신호발생 과 같은 주기 기 간에 하게 한다. 

우에 서 서 술된 방법 들은 일 반적 인메 특정한 실 현은 이 기 술들의 변종이 든가 조합에 
의하여 이 루어 진다. 

3. 주소발생 

우려는 형식화에 대한 고찰과 일반적론리요구의 견지에서 순서화문제를 고찰하였다. 
다음주소가 어디에서 어떻게 만들어 지는가 하는것을 다른 견지에서 보기로 하자. 

표 15-3 에 여 러 가지 주소발생방법들을 주었 다. 이것들은 주소가 마이 크로명 령 에서 
명백히 유용한 명시적 인 기술들과 주소를 발생하기 위한 보충적 인 론리를 요구하는 암시 
적기술로 나눌수 있다. 



그림 15-7. 분기조종론려，한개의 주소구역 
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표 15-3. 마이크로명령의 

주소발생기술 

명시적 

암시적 

두마당 

배치 

무조건 분기 

추가 

조건 분기 

오차조종 


여기서는 주로 명시적기술을 취급하였다. 두 
마당방식을 리용하여 두개의 서로 다른 주소를 
개개의 마이크로명령과 함께 리용한다. 하나의 
주소마당이 라든가 가변형 식 화를 리 용하여 여 러 
가지 분기명 령을 실현할수 있다. 조건분기명령 
은 다음과 같은 정보의 형태에 의존한다. 


• ALU 기 발들 

• 조작코드부분이든가 기 
계명령의 주소방식마당 

• 부호비트와 같은 선택된 
등록기 부분 

• 조종장치안의 상태비 트 

여 러 가지 의 암시 적기 술이 또한 
자주 리용된다. 이들가운데서 하 
나 즉 배 치화가 모든 설계 를 가 
상화할것을 요구한다. 기계명령의 
조작코드부분은 마이크로명령주 
소에 배 치 되 여 야 한다. 이 것 은 명 
령 주기 당 오직 한번만 제 기 된다. 

일 반암시 적기 술은 완료주소를 
만들기 위하여 주소의 두 부분을 
결 합하거 나 더하는 방법 이 다. 이 
방식 은 IBM /360 계 렬 [ TUCK 67] 에 
서 가 아니 라 S /370 모델의 대 부분 
에서 리용되 였다. 여 기서는 IBM 
3033 을 실 례 로 실명 하려 고 한다. 
IBM 3033 의 조종주소등록기는 13 bit 길이를 가지며 그림 15-9 에 보여 주었다. 주소 
의 두 부분은 구별할수 있다. 제 일 웃자리 8 bit (00 〜 07) 는 한 마이크로명 령주기로부터 다 
음마이 크로명 령주기 까지 일반적 으로 변하지 않는다. 마이 크로명 령 이 실행되 는 동안 이 
8 bit 는 마이 크로명 령 의 8 bit 마당 (BA 마당) 으로부터 조종주소등록기 의 제 일 웃자리 8 bit 에 
로 직접 넘 어 간다. 조종기억 기 안에서 32 개의 마이크로명 령 을 하나의 블로크로 정의 한다. 
조종주소등록기의 나머지 5 bit 는 다음에 꺼내야 할 마이크로명령의 정해 진 주소를 규정 



|명령등록기| 


그림 15-8. 분기조종론리, 가변형식 
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하는 부분이 다. 매개 비트는 현행마이크로명 령안의 4 bit 마당 (7 bit 마당을 제외)에 의하여 
결정 된다. 이 마당은 대 응하는 비 트를 설정 하기 위한 조건을 규정한것 이 다. 례하면 조종 
등록기 안의 비 트가 ALU 연산의 마지 막에 자리 올림 이 생 기 는가 안생 기 는가에 따라 1 혹은 
0으로 설정될수 있다. 


00_07 08 09 10 11 12 







□ 

- i - 丄 J 丄 J 

1 

BF(7) 


BA(8) BC(4) BE(4) 

그림 15-9. IBM 3033 조종주소등록기 

마지막방식을 표 15-3 에 주었는데 이것을 나머지조종이라고 한다. 이 방식은 조종장 
치 안의 림 시등록기 에 이 미 보관된 마이 크로명 령주소의 리용을 포괄하고 있다. 례하면 일 
부 마이 크로명 령 들은 보조프로그람처 리 기 술을 장비 하고 있다. 내 부등록기든가 등록기 의 
탄창은 복귀주소를 보관하군 한다. 이 방식의 실례 를 LSI -11 에 서 리용하였 다. 그에 대 하 
여 보기로 하자. 

4. LSI -11 마이크로명령순서화 

LSI -11 은 PDP -11 를 극소형를퓨터화한것으로서 체계의 기본요소들은 한 기판에 조립 
하였 다. LSI -11 은 마이 크로프로그람조종장치 를 리 용한것 이 다 [ SEBE 76]. 

LSI -11 은 22 bit 의 마이 크로명 령 과 2 K 22 bit 단어 의 조종기억 기 가 있 다. 다른 마이 크로 
명 령 주소는 다섯 가지 방법가운데 서 어 느 하나에 의하여 결정 된다. 

• 다음순차주소: 다른 명령 이 없는 경우에 조종장치안의 조종주소등록기는 하나만 
큼 증가된다. 

• 조작코드배 치 : 매개 명 령주기의 시 작에서 다음에 실행할 마이크로명 령의 주소는 
조작코드에 의하여 결정 된다. 

• 보조프로그람호출기 능: 앞에 서 설명하였 다. 

• 새치기검사:어떤 마이크로명령들은 새치기에 대한 검사를 규정한다.만일 새치기 
가 일어 난 경우 이것 이 다음에 실행할 마이크로명 령의 주소를 결정한다. 

• 분기 : 조건 및 무조건분기마이크로명령이 리용된다. 
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한 준위 보조프로그람호출기능이 제 공되 여 있다. 매 개 마이크로명 령 안에서 lbit 가 이 
과제를 지적한다. 이 비트가 설정되면 libit 로 된 복귀를 규정하고 보조마이크로명령은 
복귀등록기로부터 조종주소등록기에 넣어 지게 한다. 

복귀는 무조건분기명령의 한 형태이다. 무조건분기의 다른 형태는 조종주소등록기의 
비트들이 libit 의 마이크로명령으로부터 넣어 지게 한다. 조건분기명령은 마이크로명령 
안의 4 bit 의 검사코드를 리용한다. 이 코드들은 분기를 결정 하는 여 러가지 ALU 조건코 
드의 검사를 규정한다. 만일 조건이 참이 아니면 다음순서의 주소를 선택한다. 참인 경우 
조종주소등록기의 제 일 아래 자리 8 bit 에 마이크로명 령의 8 bit 가 넣 어 진다. 이것은 분기 
가 256 단어폐지의 기 억기내에서 진행될수 있게 한다. 

알고 있는바와 같이 LSI -11 은 조종장치내 에 강력한 주소순서 화기 구가 장비 되 여 있 
다. 이것으로 하여 마이크로프로그람작성자들은 고찰에서 유연성을 보장할수 있고 마이 
크로프로그람작성을 쉽게 할수 있다. 다른 한편 이 방식은 보다 더 많은 조종장치론리를 
요구한다. 


제3절. 마이크로명령실행 

마이 크로명 령 주기 는 마이 크로프로그람화된 처 리 장치 에 서 기 본문제 로 된 다. 매 개 명 
령주기는 두개의 부분으로 되여 있는데 그것은 꺼내기와 실행주기이다. 꺼내기부분은 마 
이크로주소의 생성에 의하여 결정되는데 이에 대하여서는 앞절에서 취급하였다. 이 절에 
서도 마이크로명 령에 대하여 취급한다. 

마이크로명 령의 실행효과는 조종신호를 발생시키는것 이 라는것을 상기해 보자. 이 신 
호의 일부는 처리장치의 내부를 조종한다.나머지신호들은 외부조종모선이든가 다른 외부 
대면부를 조종하는 신호이다. 흔히 있는 기능을 리용하여 다음마이크로명령의 주소를 결 
정 한다. 

앞에 서 진행한 서 술에서 는 그림 15-10 에서 보여 준 조종장치 의 구성 을 론의하였 다. 
그림 15-4 에서 수정된 부분을 이 절에서 강조한다. 이 그림에서 기본모둘은 지금 그려 
있지 않다. 순서 화론리 모둘은 앞절 에 서 서 술한 기능을 수행 하기 위한 론리 가 들어 있 다. 
이 모둘은 명 령 등록기 ， ALU 기 발，조종주소등록기 (주소증가용) 와 조종완충등록기 를 입 구 
로 리 용하여 다음마이 크로명 령 의 주소를 발생 시킨다. 최 종적 으로는 실제주소와 조종비 트 
혹은 그것 을 둘다 만들어 낸 다. 이 모둘은 마이 크로명 령 의 동기 를 결정하는 박자에 의하 
여 조종된다. 

조종론리모둘은 마이 크로명 령안의 일 부 비 트의 기 능을 가지 고 조종신호를 만든다. 
마이 크로명 령 의 형 식 화와 내 용이 조종론리모둘을 복잡하게 만들것 이 라는것 은 명 백하다. 
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마이크로명령의 분류 


마이크로명 령은 여 러가지 방법으로 분류할수 있다. 일반적으로 문헌에 의한 분류는 
다음과 같다. 

• 수직/수평 

• 채워 넣기/도로빼기 

• 하드/쏘프트웨어마이크로프로그람 

• 직접/간접부호화 


이 모든것들은 마이크로명령 
의 형식화에 영향을 준다. 이 특 
성들의 쌍을 조사하는것은 마이 
크로명령설계의 선택을 고찰하 
는데 도움을 준다. 다음절에서 
먼저 이 특성의 모든 쌍들에 깔 
려 있는 기본설계항목을 고찰하 
고 그다음 매개 쌍에 의 하여 제 
기되는 개념들을 보기로 하자. 

월크스가 제 기 한 초기 제 안에 
서는 마이크로명 령의 매개 비트 
는 직접 조종신호를 만들든가 
혹은 직접 다음주소의 한비트를 
만들었다. 우리는 이미 앞절에서 
적은 마이크로명령비트를 리용 
하여 보다 복잡한 주소순서화를 
할수 있다는것을 학습하였다. 이 
방안은 보다 복잡한 순서화론리 
모둘을 요구한다. 이러한 단계에 
대 한 류형 은 조종신호와 관련된 마이 크로명 령 부분에 서 도 존재 한다. 조종정 보를 복호화하 
며 그리고 조종신호를 만들기 위하여 그것을 순차로 해신하는 방법으로 조종단의 비트를 
절약할수 있다. 

이 부호화를 어떻게 할수 있는가? 그에 대한 대답을 하기 위하여 조종장치에 의하여 
조종되는 K 개의 서로 다른 내부와 외부조종신호가 있다고 하자. 월 크스의 방안에서는 



그림 15-10. 조종장치구성 


조종 조종 
신호 신호 
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마이크로명 령의 Kbit 가 모두 이 목적 에 리용된다. 이것은 명 령주기기 간 발생되는 2 K 개 
의 가능한 조종신호조합을 만들수 있다. 그러나 가능한 조합이 다 리용되지 않는다면 이 
보다 더 잘할수 있다. 실례들에는 다음과 갈은것들을 포함하고 있다: 

• 두 원 천주소는 갈은 목적 주소로 조종될 수 없 다 (그림 14-5 에 서 어 와 C 8 ). 

• 하나의 등록기는 원천주소와 목적주소를 둘 다 읽을수 없다(그림 14-5 에서 C 5 와 
<그12) • 

• 조종신호들가운데서 오직 하나의 패 런만이 한번에 ALU 에 가해 질수 있다. 

• 조종신호들가운데서 오직 하나의 패턴만이 한번에 외부조종모선에 나타날수 
있 다. 

그러므로 주어 진 처리장치에 대하여 조종신호의 가능한 모든 조합은 <3<2또 으로 주 
어 지며 그에 대 한 목록을 작성할수 있다. 이것은 ( log 2 Q)<K 가 성 립 하는 log 2 Q 비트로 
해신된다. 여기에는 조종신호의 가능한 조합들을 보존하는 부호화의 모든 형식들이 집중 
되여 있다. 실천적으로 이러한 형태의 부호화는 쓰지 않는다. 그 리유는 다음과 갈은 두 
가지에 있다: 

• 순수한 해신(월크스)방식처럼 실행순서를 짜기가 어렵다. 이 점은 후에 더 론의 
된 다. 

• 이것은 론리가 복잡해 지고 더우기 조종론리모둘의 속도가 떠지게 한다. 

그에 대한 몇가지 절충안이 제기되고 있는데 대표적인것은 다음의 두 종류이다: 

• 가능한 조합을 해신하기 위하여 필요량보다 더 많은 비트를 리용한다. 

• 물리적으로 가능한 일부 조합들은 부호화할수 없다. 

후자의 경우의 위태로움은 비트수를 감소시키는 효과를 가져 온다. 그러나 순리득은 
iog 2 e 비트이상을 리용하는데 있다. 

다음소제 목에서 특별한 부호화기 술을 론의 한다. 이 소제목의 나머지부분에서 는 부호 
화의 효과와 그것을 서술하는데 리용된 여 러가지 용어들을 취급한다. 

앞에서 진행한 고찰에 기초하면 마이크로명령형식의 조종신호부분은 하나의 스펙트 
르에 떨어 진다는것을 알수 있다. 한 극단에는 모든 조종신호를 위한 하나의 비트가 있 
으며 다른 극단에서는 높은 수준으로 부호화된 형식을 리용한다. 표 15-4 는 마이크로프 
로그람화된 조종장치의 다른 특성들 역시 그의 스펙트르가 대체 로 부호화스펙트르의 정 
도에 의하여 결정되는 스펙트르대역내에 떨어 진다는것을 보여 주고 있다. 

표에 서 두번째 항목의 쌍은 오히 려 명 백하다. 순수한 월 크스방식 은 많은 비 트들을 
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요구한다. 또한 이 극단이 하드웨 어의 가장 상세 한 고찰을 준다는것도 명백 하다. 매 조종 
신호는 마이크로프로그람작성자에 의하여 개별적으로 조종할수 있다. 부호화는 기능 혹 
은 자원을 집합하는 방법으로 수행되므로 마이크로프로그람작성자는 보다 높지만 덜 상 
세 한 준위 에 서 처 리 장치 를 고찰하고 있 다. 게 다가 부호화는 마이 크로프로그람작성 부담을 
줄이도록 진행된다. 또한 모든 조종신호의 리용을 리해하고 조화롭게 종합하는 과제가 
어 려운 과제라는것이 명백하다. 우에서 언급한바와 같이 일반적으로 부호화의 결론들중 
의 하나는 어떤 다른 허용조합의 리용을 방지하는것 이 다. 

우에서 서 술한것 은 마이 크로프로그람작성 자의 견지 에서 마이 크로명 령 설계를 론의 한 
것 이 다. 그러 나 부호화의 정도는 하드웨 어 효과로부터 고찰할수도 있다. 순수한 부호화되 
지 않은 형식인 경우 해신론리는 적게 혹은 전혀 요구되지 않는다. 즉 매 비트는 특별한 
조종신호를 발생한다. 보다 함축되고 보다 집약된 부호화방식을 리용하므로 보다 복잡한 
해신론리가 요구된다. 따라서 이것은 성능에 영향을 줄수 있다. 보다 복잡한 조종론리모 
둘의 문회로들을 통하여 신호를 전파시키는데 더 많은 시간이 요구된다. 따라서 부호화 
된 마이크로명령의 실행은 부호화되지 않은 마이크로명령의 실행보다 시간이 더 오래 걸 
린다. 

결국 표 15-4 에서 보여 준 모든 특성들은 설계전략의 범주에 속한다. 일반적으로 스 


표 15-4. 마이크로명령범주 



특 

징 

부호화하지 않는다 


부호화를 해야 한다 

비트가 많다 


비트가 적다 

하드웨어의 구체적인 고찰 


하드웨어의 개괄적인 고찰 

프로그람작성이 어렵다 


프로그람작성이 쉽다 

동시성이 충분히 활용된다 


동시성을 활용하지 않는다 

조종론려가 적거나 없다 


조종론리가 복잡하다 

실행속도가 빠르다 


실행속도가 느리다 

성능을 최량화할수 있다 


프로그람작성을 최량화할수 있다 


전 

문 용어 

비 묶음 


묶음 

수평 


수직 

하드 


쏘프트 


508 



펙트르의 왼쪽 끝방향으로 떨어 지는 설계는 조종장치의 성능을 최적화하는데 리용된다. 
오른쪽 방향으로 떨어 지는 설계는 마이크로프로그람작성의 처리공정을 최적화하는데 크 
게 관계된다. 범주의 오른쪽 가까이에 있는 마이크로명령모임은 기계명령모임과 매우 류 
사하게 보인다. 이 에 대 한 좋은 실례 에는 이 절에서 후에 서 술되는 LSI -11 설계 이다. 일 
반적 으로 조종장치를 실현하기 위한 목적 이 간단하면 그 설계 는 범주의 왼쪽 끝가까이 에 
있을것 이 다. 후에 론의 하겠지 만 일부 체 계 는 여 러 사용자들이 갈은 마이 크로명 령 설 비 를 
리 용하여 각이한 마이 크로프로그람을 구성하도록 한다. 후자의 경 우에 설계 는 범 주의 오 
른쪽 가까이에 떨어 지게 된다. 

이전에 언급되였던 전문용어들에 대하여 주의를 돌리자. 표 15-4 는 이 용어들의 3가 
지 쌍이 마이크로명 령범주와 어떻게 관계되는가를 보여 주고 있다. 사실상 이 쌍들은 서 
로 다른 설 계특성 들을 강조하지 않는 갈은 실 체 들을 서 술하고 있 다. 

묶음정도는 주어 진 조종과제와 특별한 마이크로명령비트들사이에 동일성정도에 관 
계된다. 비트들이 보다 묶어 지게 되므로 주어 진 수의 비트들은 더 많은 정보를 포함한 
다. 결국 묶음은 부호화를 의미한다. 수평과 수직은 마이크로명령의 상대적인 너비에 관 
계된다. [ SIEW 8 幻은 수직마이크로명 령 이 16~40 bit 의 범위의 길 이를 가지며 수평마이 크로 
명 령 이 40~100 bit 범 위 의 길 이 를 가진 다는것 을 엄 지 손가락규칙 으로 제 기 하고 있 다. 하드 
및 쏘프트마이 크로프로그람작성 은 기 본조종신호와 하드웨 어배 치사이의 밀착성 정도를 암 
시 하는데 리 용된 다. 일 반적 으로 하드마이 크로프로그람은 ROM 에 고정 된 다. 쏘프트마이 크 
로명 령프로그람은 자주 변화시 킬수 있으며 사용자의 마이 크로프로그람작성 을 가능하게 
한다. 

이 소계 목을 시작하면서 언급한 술어들의 다른 쌍들은 이제 고찰하려고 하는 대상들 
인 직접 및 간접부호화에 귀착된다. 

2. 마이크로명령부호화 

실천적으로 마이크로프로그람화된 조종장치는 순수한 부호화되지 않거나 수평인 마 
이크로명령형식화를 리용하여 설계되지 않았다. 일부 부호화는 조종기억기의 폭을 최소 
한 줄이 며 마이 크로프로그람작성 을 간단화하기 위 하여 리 용되 였 다. 

부호화의 일부 수법을 그림 15-11 가 에 보여 주었다. 마이크로명 령은 한조의 마당으 
로 구성되 였다. 매개 마당에는 코드가 들어 있는데 그것은 이 코드가 해신되여 하나 혹 
은 여러개의 조종신호를 능동으로 만든다. 

이 배 렬의 의미(련관관계)에 대 하여 보기로 하자. 마이크로명 령 이 해신될 때 매개 
마당은 해 신되 여 조종신호를 발생 시킨다. 따라서 N 개 의 마당을 가지 고 N 개 의 동작을 동 
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시에 규정할수 있다. 매개 동작은 하나 혹은 여러개의 조종신호를 능동으로 만든다. 늘 
그렇지는 않지만 일반적으로 매개 조종신호가 하나의 마당정도에 의하여 능동이 되도록 

형식화를 설계하는것 이 필요하다. 그 
런데 매개 조종신호가 최소한 하나의 
마당에 의하여 능동이 될 가능성이 있 
는가 하는것을 명백히 해두는것이 필 
요하다. 

여기서 개별적인 마당을 고찰해 보 
자. Lbit 로 구성된 마당에 는 2 L 코드들 
가운데서 하나가 들어 갈수 있으며 그 

의 매개는 서로 다른 조종신호패런으 
로 부호화될수 있다. 왜 냐하면 하나의 
코드만이 한번에 하나의 마당에 나타 
날수 있기때문에 코드들은 호상 배타 
적이며 따라서 그들이 발생시키는 동 
작도 호상 배 타적 이 다. 

부호화된 마이크로명 령 형식의 설계 
는 다음과 갈은 단순한 항목에서부터 
시작된다. 

• 형식화는 독립적 인 마당들로 구성 한다. 즉 매개 마당은 서로 다른 마당에 의 하여 
생기는 동작들이 동시에 일어 나도록 한묶음의 동작을 담고 있어야 한다. 

• 마당에 의하여 규정될수 있는 선택된 동작들은 호상 배 타적 이 되도록 매개 마당 
을 정의 하여 야 한다. 즉 주어 진 마당에 의 하여 규정된 동작들가운데서 오직 하 
나만 동시에 일어 날수 있다. 

두 방식들은 부호화된 마이크로명 령 즉 기능과 원천으로 된 마당으로 구성할수 있다. 
기 능부호화방식 은 기 계안의 기 능을 규정 하며 마당을 기 능형 식 으로 표시한다. 례 하면 만 
일 자료를 축적등록기로 전송하는데 여러가지 원천들을 리용한다면 한마당은 이 목적을 
표시하며 매개 코드는 원천의 종류를 의미한다. 자원코드화는 기계가 독립적인 자원묶음 
을 구성 하고 있는것 처 럼 보자는데 있으며 개 개 (례 하면 I / O , 기 억 기 , ALU ) 에 하나의 마 
당을 할당한다. 

부호화의 다른 측면은 그것 이 직접인가, 간접인가하는것 이다(그림 15-11 1-). 간접 
부호화를 리용하여 한 마당이 다른 마당에 대한 해석을 결정하군 한다. 례를 들어 8 
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그림 15-11. 마이크로 명령부호화 
" T - 직접부호화， L - 간접부호화 





























개의 산수연산과 8개의 밀기조작을 수행할수 있는 ALU 를 고찰해 보자. lbit 마당은 


간던:한_ 등록기 ^ i 송 
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I 0,1,1| 0,1,0| I ] 

|0|1.1|0|1|1 I ■ ] 

lO . lilll.OiOl I ] 

등록기 선택 

n ) 


밀기조작인가 혹은 산수연산인가를 
지 적 하는 마당이 다. 3 bit 마당은 그 조 
작을 수행하는 마당이다. 이 방법은 
일반적으로 두개의 해신준위를 가지 
므로 전달지연시간이 커진다. 

그림 15-12 는 이 개념을 실례로 준 
것 이 다. 프로그람계 수기 와 ALU 입 구 
를 위한 림시등록기처럼 하나의 축적 
등록기와 여러개의 내부등록기들을 
가진 처리장치에 대하여 가정해 보자. 
그림 15-12 가는 수직형식을 보여 준 
다. 첫 3 bit 는 조작의 종류를 지적하 
며 그다음 3 bit 는 조작을 부호화하며 
마지 막 2 bit 는 내 부등록기 를 선택 한다. 
그림 15-12 1■는 여전히 부호화를 리 
용하지 만 보다 더 수평방식 에 접 근하 
여 있다는것을 보여 준다. 이 경우에 
서로 다른 기능이 서로 다른 마당에 
나 타난다. 

3. LSI -11 마이크로명령실행 


CSAR ^— 복호화된 MDR 

CSAR - — 상수 

(다음바이트에서) 

뛰여넘기 

ACC == ACT +등록기 

ACC M - ACC -등록기 

ACC -— 등록기 
등록기 ，■•一 ACC 
ACC -등록기 +1 


0 1 2 3 4 5 6 7 8 9101112131415161718 


마당 12345 6 


마당정의 

1- 등록기 전송 

2- 기억기조작 
3~순차조작 

4- 산수론리^4^치 

5- 등록기선택 
6■상수 

니 


MDR : 기억자료등록기 
CSAR: 호화된 기억기 
ACC :축적등록기 


그림 15-12. 단순한 기계에서 마이크로명령형식 
1- 수직 마이 크로명 령， L - 수평 마이 크로명 령 


LSI -11 은 수직마이 크로명 령 의 좋 
은 실례이다. 여기서는 먼저 조종장치 
의 내부구성을 보고 그다음 마이크로명 
령형식을 보기로 하자. 

LSI -1 1 조종장치의 구성 

LSI -11 은 한 기판으로 된 PDP -11 
계렬의 첫 를퓨터이다. 기관에는 3개의 
LSI 소편,마이 크로명 령모선 ( MIB ) 으로 
된 내부모선 그러고 몇가지 대면론리회 
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로로 구성되 여 있다. 

그림 15-13 에 LSI -11 처리장 
치의 구성에 대하여 간단히 보여 
주었다. 3 개의 소편은 자료소편, 
조종소편, 조종기억 소편을 말한다. 
자료처 리 소편은 한개 의 8 bit ALU , 
26 개 의 8 bit 등록기 들, 여 러 개 의 
조건코드를 기억하기 위한 기억기 
로 이루어 져 있다. 26 개의 8 bit 
등록기들가운데서 16 개의 등록기 
들은 2 개씩 짝을 무어 8 개의 
16 bit PDP -11 의 일 반등록기 로 쓸 
수 있다. 다른 등록기들은 프로그 
람상래단어등록기 , 기 억주소등록 
기 ( MAR ) 그리 고 기 억 완충등록기 
로 된다. ALU 는 한번에 8 bit 씩 
만 처 리 하므로 16 bit PDP -11 산수연산을 실현하려 면 ALU 를 통하여 8 bit 자료를 두번 통 
과시켜 야 한다. 이 과정은 마이크로프로그람에 의하여 조종된다. 

조종기억소편이든가 소편들은 22 bit 폭의 조종기억기로 구성되 여 있다. 조종소편은 
마이크로명 령순서 화와 실행을 위한 론리를 수행 한다. 거기 에는 조종주소등록기 와 조종자 
료등록기 그러고 기계어명령등록기의 내용이 들어 있다. 

모든 요소들은 다 MIB 를 통하여 결합된다. 마이크로명령을 꺼내는 기간 조종소편은 
MIB 에 libit 의 주소를 내 보낸다. 조종기 억 기 가 호출되 면서 MIB 에 놓여 있 는 22 bit 로 
된 마이크로명령이 출력된다. 이가운데서 아래자리 16 bit 는 자료소편으로, 한편 아래자리 
18 bit 는 조종소편으로 출력 된 다. 웃자리 4 bit 는 특수한 처 리 장치 기 능들을 조종한다. 

그림 15-14 는 LSI -11 조종장치에 대하여 간단하면서도 보다 구체적으로 고찰할수 있 
게 하였다. 그림 에서는 개별적 인 소편의 경계는 무시하였다. 제 2 절에서 서술된 주소순서 
화는 두개 모둘로 구성되여 있다. 모든 순서조종은 마이크로순서조종모둘에 의하여 조종 
되는데 이 모둘은 마이크로명 령주소등록기의 증가와 무조건분기의 실현을 할수 있다. 주 
소계산의 다른 형태는 개별적인 주소변환배렬에 의하여 수행된다. 이것은 마이크로명령， 
기계 어명 령 , 마이크로명 령프로그람계수기 , 새 치기등록기 에 기초하여 주소를 할당시 키는 
조합회 로이 다. 



그림 15-13. LSI -11 처 러소자의 간단한 구성도 
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주소변환배렬은 다음과 같은 경우에 리용 
1 조종자^■등록ᄁ — 된다. 



그림 15-14. LSI -11 구성 
검사하게 된다. 

• 새 치기조건들이 주기적으로 검사 
된 다. 

• 조건분기마이크로명령을 평가한 
다. 


• 조작코드는 마이 크로루린(보조프로그람) 
의 시 작을 결 정하는데 리 용된 다. 

• 필 요한 때 에 마이 크로명 령 의 주소방식비 
트들은 해 당한 주소화를 수행하는것 을 

4 11_16_ 

| 하기능| | |一부호화된 마이 크로조작一 



5_ n 


조작코드 

이행 주소 

무조건 이 행 마이 크로명 령 형 식 

4 


4 

8 


조작코드 

시험 코드 

이행 주소 

조건 이 행 마이 크로명 령 형 식 

4 


8 


4 

조작코드 I 

상수값 

A 등록기 

직 역 마이 크로명 령 형 식 

8 



4 

4 

조작코드 

등록기 

등록기 

등록기마이크로명령형식 


LSI -11 마이크로명령형식 

LSI -11 는 22 bit 폭을 가진 수직마이 
크로명 령형식 을 리 용한다. 마이크로명 령 
은 그것을 실현한 PDP -11 기계어명령과 매우 류사하다. 이 설계는 수직프로그람설계하에 
서 조종장치의 성능을 최적 화하자는데 있다. 표 15-5 는 일부 LSI -11 마이크로명 령 을 보여 
주었다. 

그림 15-15 는 22 bit LSI -11 마이크로명 령형식을 보여 주었다. 웃자리 4 bit 는 처리장 
치의 특수한 기능을 조종한다. 변환비트는 주소변환배렬이 새치기를 검사하게 한다. 넣기 


그림 15-15. LSI -11 마이크로명령형식 
완전 LSI -11 마이크로명 령형식, l - LSI -11 
마이크로명령의 부호화된 부분의 형식 
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복귀 등록기 비 트는 마이 크로명 령 의 끝에 서 리 용하여 다음마이 크로명 령 주소와 복귀 등록기 
로부터 읽기 되게 한다. 

나머지 16 bit 는 부호화된 마이크로명령을 위하여 리용된다. 이 마이크로명령형식은 
가변길이조작코드와 하나 혹은 여러개의 연산수를 가진 기계명령과 매우 류사하다. 


표 15-5. LSI -11 의 일부 마이크로명령 


산수연산 

일 반조작 

단어 더하기 (바이트, 문자) 

단어 (바이트) 이동 

단어 검사 (바이트, 문자) 

이행 

한단어 (바이트) 증가 

되돌이 

두단어 (바이트) 증가 

조건 이 행 

단어(바이트)부정 취하기 

기발설정 (재설정) 

조건에 따라 바이트 증가(감소) 

G 에 0을 넣기 

조건에 따라 단어(바이트)더하기 

조건에 따라 단어(바이 트)이 동 

자리올림을 포함한 단어 (바이트)더하기 

입 출구조작 

조건에 따라 10진수더 하기 

단어 (바이 트) 입 구 

단어 (바이트) 덜기 

상래 단어 (바이 트) 입 구 

단어 (바이트)하나 감소 

읽기 

론리조작 

쓰기 

단어 (바이트，문자)론리 곱하기 

읽 기(쓰기 ) 한 다음 한단어(바이 트) 증가 

단어 (바이트)검사 

읽 기 (쓰기 )한 다음 두단어 (바이트) 증가 

단어 (바이트) 론리 더하기 

읽 기 (쓰기 ) 응답 

단어 (바이트)배타적 론리합 

단어출구(바이 트, 상태 ) 

단어 (바이트) 비트지 우기 


자리올림이 있는(없는) 단어(바이트)모 


른쪽 (왼쪽) 밀기 


단어 (바이트)보수 



4. IBM 3033 마이크로명령실행 

표준 IBM 3033 조종기 억 기 는 4 K 단어 로 구성 되 여 있 다. 첫 번째 의 절 반인 0000〜 07 FF 
에 는 108 bit 의 마이 크로명 령 이 들어 있으며 나머 지 0800〜 0 FFF 는 126 bit 의 마이 크로명 
령이 기억된다. 이 형식을 그림 15-16 에 주었다. 이것은 어느 정도 수평형식이지만 부호 
화는 쉽다. 이 형 식 화의 기 본마당을 표 15-6 에 종합하여 주었 다. 

ALU 는 사용자가 볼수 없는 4개의 전용등록기 A , B , C , D 로부터 나오는 입구자료를 처 
리한다. 마이크로명 령형식은 사용자등록기로부터 나오는 자료를 이 등록기 에 넣 기 위한 
마당들로 구성되 여 있다. 이 사용자가 쓸수 있는 등록기 (사용자용등록기)는 ALU 기능을 
수행하거 나 결과를 기 억하기 위하여 사용자가 쓸수 있는 등록기를 규정한다. 이외 에 등 
륵기 와 기 억 기 사이에 자료를 넣 거 나 기 억 시 키 기 위한 마당이 있 다. 

IBM 3033 의 순서화과정 을 제 2 절에서 취급하였 다. 


514 







fp] AA | AB | AC | AD | AE 



AF | A~ 

一 


| AH jAj[ AK 


jAL| 


36______ 71 

|p| BA | BB | BC I BD | BE | BF | BH | 

卜 다음*소 ~■ Z ， 1 


72_107 


Ip 

BH | CA |CB( CC 

1 CD | 

브 1 CF 1 CG 

1 CH | 

기으 

밀기조 

국거 억’ 

여 러 가지 '조종 



108 __ 125 

|p|da| DB I DC I DP I DE I 

검사 1 f 조건코드설 n 

그림 15-16. IBM3033 마이크로명 령형식 


표 15-6. IBM 3033 마이 크로명 령 조종마당 


ALU 조종마당 


AA ⑶ 

임의의 자료등록기에서 A 등록기에 넣기 



AB ⑶ 

임의의 자료등록기에서 B 등록기에 넣기 



AC ⑶ 

임의의 자료등록기에서 C 등록기에 넣기 



AD (3) 

임 의 의 자료등록기 에 서 D 등록기 에 넣 기 



AE (4) 

규정 된 A 비 트를 ALU 에 보내 기 



AF (4) 

규정 된 B 비 트를 ALU 에 보내 기 



AG (5) 

A 입 구에 대 한 ALU 론리 연산을 규정 



AH (4) 

B 입 구에 대 한 ALU 론리 연산을 규정 



AJ (1) 

B 쪽에 있는 ALU 에 D 혹은 B 입구를 규정 



AK (4) 

밀기등록기에 산수연산출구 보내기 



CB (1) 

밀기등록기 능동 



CC (5) 

론리적 및 자리올림기능을 규정 



CE (7) 

밀기등록기값을 규정 



CA (3) 

F 등록기에 적재 



순서 화와 분기마당 

AL (1) 

조작완료와 분기수행 



BA (8) 

조종주소등록기의 높은 자리비트 (00-07) 를 설정 


BB (4) 

조종주소등록기의 비트 8을 설정 하기 위해 

조건을 

규정 

BC (4) 

조종주소등록기의 비트 9을 설정 하기 위해 

조건을 

규정 

BD (4) 

조종주소등록기 의 비 트 10을 설 정 하기 위해 

조건을 

규정 

BE (4) 

조종주소등록기 의 비 트 11을 설 정 하기 위해 

조건을 

규정 

BF (4) 

조종주소등록기 의 비 트 12을 설 정 하기 위해 

조건을 규정 
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8800 SDB 는 다음과 같은 구성 요소로 되 여 있 다(그림 15-17). 

• 마이크로코드기억기 

• 마이크로순서기 

• 32 bit 산수-론리 연산장치 

• 류점수 및 옹근수처리소자 

• 국부자료기억기 

체 계의 내부요소들은 두개의 모선에 련결되 여 있다. DA 모선은 마이크로명 령자료마 
당으로부터 ALU , 류점수처 리장치 혹은 마이크로순서기 에로 자료를 전송하기 위한것 이 다. 
후자의 경우에 자료는 분기명령의 경우에 리용되는 주소로 구성되여 있다. 모선은 또한 
다른 요소에 자료를 전송하기 위하여 ALU 혹은 마이크로순서기에 리용된다. 체계 Y 모 
선은 ALU 와 류점수처 리 장치를 PC 대면부를 통하여 국부기 억 기와 외부모둘에 련결한다. 

이 기판은 IBM-PC 호환가능한 주콤퓨터에 적 합하다. 주콤퓨터는 마이크로코드번역 
과 오유수정 을 위한 가동환경 이 다. 

1. 마이크로명령형식 

8800을 위한 마이크로명 령형 식은 128 bit 로 구성되 여 있는데 표 15_7에서 보여 준것 
처럼 기능마당으로 나뉘여 져 있다. 매개 마당은 하나 혹은 여러개의 비트들로 되여 있 
으며 5개의 기본부류로 구성되 여 있다: 

• 기판의 조종 

• 8847 류점수 및 옹근수처 리 장치 소편 

• 8832 등록기 화된 산수-론리 연산장치 ( ALU ) 

• 8818마이 크로순서 기 

• WCS 자료마당 

그림 15-17 에 서 보여 주는바와 같이 WCS 자료마당의 32 bit 는 DA 모선에 출력 되 며 
그것은 자료로서 ALU 류점수처리장치 혹은 마이크로순서기에 공급(입력)된다. 마이 
크로명령의 다른 96 개 비트(마당 1-27) 는 해당한 모둘에 직접 가해 지는 조종신호로 
된다. 설명 을 간단히 하기 위 하여 이 외의 다른 련결관계 는 그림 15-17 에서 보여 주지 
않았다. 

첫 6 개 마당은 개별적요소에 대한 조종이 라기보다 기판의 조종에 대한 조작을 취급한다. 
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표 15-7. TI 8800마이크로명 령형식 


마당번호 

비트수 

해 설 

기판의 조종 

1 

5 

조건코드입력선택 

2 

1 

외 부적 인 I/O 요구신 호 허 탁/금지 

3 

2 

국부자료읽 기/쓰기 조작 허 탁/금지 

4 

1 

넣기상태/넣기하지 않은 상래 

5 

2 

Y 모선을 구동하는 장치 선택 

6 

2 

DA 모선을 구동하는 장치 선택 

8847 류점 수 및 옹근수처 리 장치소편 

7 

1 

C 등록기 조종: 박자，박자없음 

8 

1 

Y 모선에 대 한 높은자리비 트 혹은 낮은자리비 트선택 

9 

1 

C 등록기자료원 천 : ALU 와 다중선택기 

10 

4 

ALU 와 MUL 에 대 하여 IEEE 및 FAST 방식 선택 

11 

8 

자료연산수에 대한 원천선택: RA 등록기, RB 등록기 ， P 등록기， 

S 등록기 , C 등록기 

12 

1 

RB 등록기 조종 : 박자，박자 없음 

13 

1 

RA 등록기 조종 : 박자，박자 없음 

14 

2 

자료원천확증 

15 

2 

관흐름등록기 허락/금지 

16 

11 

8847 ALU 기능 


8832 등록기 를 가진 산수-론리 연산장치 ( ALU ) 


17 

2 

선택된 등록기로 허락/금지된 자료출력，쓰기 : 높은자리비트절 
반 낮은자리비트절반 

18 

2 

등록기파일자료원천 선택 : DA 모선, DB 모선 ， ALU Y MUX 
출구，체 계 Y 모선 

19 

3 

밀기명령변경자 

20 

1 

자리올림을 하겠는가, 안하겠는가 

21 

2 

ALU 방식설정 : 32，16 혹은 8 bit 

22 

2 

다중선택 기 S 에 대 한 입 구선택 : 등록기 파일 ， DB 모선 ， MQ 등 
록기 

23 

1 

다중선택기 요 에 대 한 입구 선택 : 등록기파일 DA 모선 

24 

6 

쓰기하려는 파일 C 에서 등록기 선택 

25 

6 

읽 기하려 는 파일 B 에서 등록기선택 

26 

6 

쓰기 하려는 파일 A 에서 등록기선택 

27 

8 

ALU 지::寒 ' 

8818 마이 크로순서 기 

28 

12 

8818 입 구신호조종 

마당번호 

비트수 

해 설 

WCS 자료마당 

29 

16 

쓰기 가능한 조종기억자료마당의 높은자리비 트 

30 

16 

쓰기 _한 조종기 억 자료마당의 낮은자리비트 
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조종조작에는 다음과 같은것이 포함되여 있다: 


• 순서기조종을 위한 조작코드의 선택 . 마당1의 첫 비트는 조건기발이 1 혹은 0으로 설 
정 되 였는가를 지 적 하며 나머 지 4 bit 는 어 느 기 발이 설정 되 였는가를 지 적 한다. 

• PC/AT 에 I 八)요구를 보내 기 

• 국부자료기억기에 대한 읽기/쓰기조작 

• 체계 Y 모선을 구동하는 장치의 결정 . 모선에 련결된 4 개 장치 가운데서 하나를 선 
택한다(그림 15-17). 

마지막 32 bit 는 자료마당이며 거기에는 부분적인 마이크로명령에 규정된 정보가 들어 
있 다. 

마이크로명 령의 나머지마당들은 그것 이 조종하는 장치의 경우에 자주 론의된다. 이 
절의 마지 막에 마이 크로순서 기 와 등록기 화， ALU 를 고찰한다. 류점 수장치 는 새 로운 개 념 
이 아니므로 취급하지 않고 넘 어 간다. 

2. 마이크로순서기 

8818 의 기 본기 능은 마이 크로프로그람을 위하여 다음마이 크로명 령 주소를 생 성하는것 
이 다. 이 15 bit 의 주소는 마이 크로코드기 억 기 에 가해 진다(그림 15-17). 

그다음의 주소는 다섯개의 원천가운데서 어느 하나로부터 선택된다: 

1. 마이 크로프로그람계수 ( MPC ) 등록기 . 이 것은 같은 주소를 다시 리용하기 위하 
여 반복하거 나 다음명 령 을 실 행 하기 위하여 주소를 하나만큼 증가시키 는데 리 
용된 다. 

2. 탄창. 이것은 반복순환이든가 새치기로부터의 복귀와 갈은 마이크로보조루린호출 
을 지원한다. 

3. DRA , DRB 포구들，이 포구들은 마이크로프로그람을 발생시 키는 외부하드웨 어 로 
부터 두개의 보충적 인 통로를 제공한다. 이 두개 포구는 DA 모선의 제 일 웃자리 
와 아래자리 16 bit 에 각각 련결되여 있다. 이것은 마이크로순서기가 현행마이크로 
명 령의 WCS 자료마당이든가 ALU 에 의하여 계산되 는 결과로부터 나오는 다음 
명령주소를 얻자는데 있다. 

4. 등록기 계 수기 RCA 와 RCB . 이 계 수들은 주소기 억 기 를 보충하는데 리 용된 다. 

5. 외 부새 치 기 를 지 원 하기 위 하여 쌍방향 Y 포구에 대 한 외 부입 구 

그림 15-18 은 8818의 론리블로크도를 보여 준다. 이 소자는 다음과 갈은 기본기능블 
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• 다음주소가 MPC , RCA ， RCB ， 외부모선 DRA 와 DRB 와 탄창으로부터 선택될수 
있는 Y 출구다중선택기 

등록기들과 계수기들 

등록기 RCA 와 RCB 는 DA 모선，현행 마이 크로명 령 이 든가 ALU 출구로부터 나오는 
값이 넣어 진다. 그 값은 실행시 흐름을 조종하는 계수기값으로서 리용되거나 호출될 때 
마다 자동적 으로 하나 감소된다. 이 값은 또한 Y 출구다중선택 기 에 공급되는 마이 크로명 
령주소로서 리용된다. 하나의 마이크로명령주기기간 두 등록기에 대한 개별적조종은 두 
등록기에 대한 동시적 인 감소를 제외하고 다 할수 있다. 

탄창 

탄창은 여러 준위의 네스트호출이든가 새치기 그리고 분기와 순환을 지원한다. 이 
조작은 모든 처 리 장치 가 아니 라 조종장치 를 말하는것 이 며 가지 고 있 는 주소는 조종기억 
기안의 마이크로명령의 주소이다. 

탄창조작은 다음과 갈은 6가지 가 가능하다 : 

1. 지우기. 탄창지시기를 령으로 설정하고 탄창의 내용을 비운다. 

2. 탄창에서 꺼내기. 이것은 탄창지시기를 하나 던다. 

3. 탄창에 넣기 . MPC ， 새 치 기복귀등록기 혹은 DRA 모선의 내용을 탄창에 넣 고 탄창 
지시기를 하나 증가시킨다. 

4. 읽기. 이것은 주소가 Y 출구다중선택기에서 가능한 읽기지시기에 의하여 지적되게 
한다. 

5. 유지. 탄창지시기의 주소가 변하지 않고 남아 있게 한다. 

6. 탄창지시기에 입력. 이것은 DRA 의 아래자리 6 bit 를 탄창지시기에 입력한다. 

마이크로순서기의 조종 

마이크로순서기는 현행마이크로명령의 12 bit 마당에 의하여 먼저 조종된다. 이 마당 
은 다음과 갈은 보조마당으로 되 여 있다. 

• OSEL(lbit) : 출력선택 . 이것은 값이 DRA 모선에 넣어 지는 다중선택기의 출구 
에 나타나게 한다. 출력 은 탄창이 든가 등록기 RCA 로부터 나오도록 선택한다. 그 
때 DRA 는 Y 출구 다중선택 기 들과 등록기 RCA 에 대 한 입 력 으로서 복사한다. 

• SELDR(lbit) : DR 모선선택 . 이것 이 만일 1 로 선택되면 이 비트는 외부 DA 모선 
을 DRA/DRB 에 대 한 입 력 으로서 선택한다. 0 으로 선택하면 DRA 다중선택 기의 
출구를 DRA 모선 (OSEL 에 의 하여 조종됨 ) 으로 선택하여 RCB 의 내 용을 DRB 모 
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선으로 출력한다. 

• ZEROIN ( lbit ) : 조건분기 를 지 적 하는데 리 용된다. 그다음 마이 크로순서 기 의 동작 
은 마당 1 에서 선택된 조건코드에 의존하게 된다 (표 15-7). 

• RC 2- RC 0(3 bit ) : 등록기 조종. 이 비 트들은 등록기 RCA 와 RCB 의 내 용에 서 의 변 
화를 결정한다. 매개 등록기는 값의 변화없이 그대로 가지고 있던가 하나 덜던가 
DRA/DRB 모선으로부터 읽기를 할수 있다. 

• S 2- S 0(3 bit ) : 탄창조종. 이 비트들은 탄창조작이 진행되 고 있음을 결정 한다. 

• MUX 2- MUX 0： 출력 조종. 이 비 트들은 조건코드와 함께 Y 출구다중선택 기 와 다음 
마이 크로명 령 주소를 조종한다. 

다중선택기는 탄창， DRA , DRB 그리 고 MPC 로부터 나오는 출력을 조종한다. 이 비 
트들은 프로그람작성자가 개별적으로 설정할수 있다. 그러나 곡 이렇게 하는것은 아니다. 
오히 려 프로그람작성 자는 일 반적 으로 쓰이 는 비 트패 런(기 계 어 )과 같은 아쌤 블리언어 를 
리 용한다. 표 15-8 은 마당 28 에 대 한 15 개 의 아쌤 블리 언어 를 표로 주었 다. 마이 크로코 
드번역 프로그람은 이 것을 해 당한 비 트패 턴으로 번역한다. 

례하면 명령 INC 88181 은 현재 선택된 조건코드가 1이면 다음마이크로명령이 순서대 
로 선택되게 하는데 쓰인다. 

표 15-8 로부터 


INC 88181 = 000000111110 


을 엄을수 있다. 이것을 다음과 같이 직접 해신할수 있다. 


표 15-8. TI 8818 마이크로순서기의 마이크로명 령비트(마당 28) 


기억 부호 

값 


해 설 

RST 8818 

000000000110 

재설정 명령 


BRA 88181 

011000111000 

DRA 명 령 에 로의 

분기 

BRA 88180 

010000111110 

DRA 명 령 에 로의 

분기 

INC 88181 

000000111110 

계속명령 


INC 88180 

001000001000 

계속명령 


CAL 88181 

010000110000 

DRA 에 의하여 규정된 주소에서 보조루린으로 뛰 여넘기 

CAL 88180 

010000101110 

DRA 에 의하여 규정된 주소에서 보조루틴으로 뛰 여넘기 

RET 8818 

000000011010 

보조루틴으로부터 

되돌이 
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표계속 


기억 부호 

값 

해 설 

PUSH 8818 

000000110111 

탄창에 새 치 기되돌이주소의 밀어 넣기 

POP 8818 

100000010000 

새치기로부터 되돌이 

LOADDRA 

000010111110 

DA 모선으로부터 DRA 계 수기 적 재 

LOADDRB 

000110111110 

DA 모선으로부터 DRB 계 수기 적재 

LOADDRAB 

000110111100 

DRA/DRB 적 재 

DECRDRA 

010001111100 

령이면 DRA 계수기와 분기감소 

DECRDRB 

010101111100 

령이면 DRB 계수기와 분기감소 


• OSEL=0:RCA 를 DRA 출구 MUX 로부터 나오는 출구로서 선택 한다. 이 경 우에 
선택은 적합하지 않다. 

• SELCR =0： 앞에서 규정된것처럼 이것은 이 명령에 대하여 적합치 않다. 

• ZEROIN =0： MUX 의 값과 결합되 여 분기 가 취해지지 않았음을 지 적한다. 

• R =000: RA 와 RC 의 현재 값을 유지한다. 

• S = lll ： 탄창의 현재 값을 유지한다. 

• MUX =110： 조건코드가 1 이면 MPC 를 선택 하고 조건코드가 0 이면 DRA 를 선 
택 한다. 

3. 등록기화된 ALU 

8832 는 64 개의 등록기를 가진 32bitALU 토서 4 개의 8bit ALU, 두개의 16bitALU, 
그리 고 하나의 32bit ALU 로서 동작하도록 구성 되 여 있 다. 

8832 는 마이 크로명 령 마당 17-27 에 의 하여 만들어 지 는 39bit 에 의 하여 조종된 다 
(표 15-7) . 이것은 조종신호로서 ALU 에 가해 진다. 더우기 그림 15-17 에서 지적된것처 
럼 8832 는 32bit DA 모선과 32bit 체계 Y 모선과 외부련결된다. DA 로부터 나오는 입력 
은 64word 등록기 파일 과 ALU 론리 모둘에 입 력 자료로서 동시 에 가해 진다. ALU 연산과 
밀기 의 결과는 출력 모선이든가 체 계 Y 모선에 출력된다. 결과는 또한 내부등록기파일 에 
다시 입력된다. 

3 개의 6bit 주소포구는 두개의 연산수꺼내기와 하나의 연산수쓰기가 등록기파일내에 
서 동시에 수행되도록 한다. MQ 밀기회로와 MQ 등록기는 또한 8bit, 16bit 의 배정확도 
조작을 실 현하기 위하여 독립 적 으로 기 능을 수행할수 있게 구성 되 여 있 다. 

매개 마이크로명 령의 마당 17 〜 26 은 자료가 8832 와 외부환경사이에서 움직 이는 방 
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법을 조종한다. 그 마당은 다음과 같다: 

17. 쓰기 허 락. 이 두비 트는 32 bit 에 대 한 쓰기 를 하는가, 웃자리 16 bit 혹은 아래 자리 
16 bit 를 따로따로 쓰기 하는가와 등록기 파일 에 쓰기 를 하지 않는가 하는것 을 규정 
한다. 

18. 등록기파일자료원천선택. 만일 등록기파일에 대한 쓰기가 생기면 이 두비트는 원 
천지 인 DA 모선， DB 모선， ALU 출구 그리 고 체 계 Y 모선가운데서 어느 하나를 선 
택 한다. 

19. 밀기명령갱신. 밀기명령이 진행되는 기간 끝을 채우는 비트들의 제공과 밀기된 
비트들의 읽기와 관련된 선택을 규정한다. 

20. 자리 올림입 구. 이 비 트로 연산을 하는 동안 ALU 에 자리 올림 을 하겠는가를 지 적 
한다. 

21. ALU 기 본방식 . 8832 는 하나의 32 bit ALU 혹은 4 개의 8 bit ALU 로 동작하게 구 
성할수 있 다. 

22. S 입 구. ALU 론리 모둘입 력 은 S 와 R 다중선택 기 라고 하는 두개 의 내 부 다중선택 
기 로부터 받는다. 이 마당은 S 다중선택 기 에 의 하여 제 공되 는 입 구인 등록기파일， 
DB 모선， MQ 등록기가운데 서 하나를 선택한다. 원천등록기 는 마당 25 에 의 하여 
규정된다. 

23. R 입 구. R 다중선택 기 에 의하여 제 공되 는 입 구인 등록기 파일 이 든가 DA 모선가운 
데 서 어 느 하나를 선택한다. 

24 . 목적 등록기 . 목적연산수를 위하여 리 용되 는 등록기 파일 에 대 한 주소이 다. 

25. 원 천 등록기 . S 다중선택 기 에 의 하여 제 공되 는 원 천 연산수를 위 하여 리 용되 는 등 
륵기파일안의 주소 

26 . 원천등록기 . R 다중선택 기 에 의하여 제 공되 는 원천연산수를 위하여 리 용되 는 등 
륵기파일안의 주소 

마지막으로 마당 27 은 8 bit 조작코드로서 ALU 에서 수행되는 산수-론리연산기능을 
규정한다. 표 15-9 에 는 가능한 조작을 목록으로 작성하여 제 기하였 다. 

마당 17〜27 을 규정하는데 리 용된 코드화의 실 례 로서 등록기 1의 내 용을 등록기 2 에 
더하여 그 결과를 등록기 3 에 넣는 명령을 보기로 하자. 아쌤블리언어명령은 다음과 같 
이 작성한다. 

CONT11 [17],WELH, SELRFYMX, [24], R3, R2, Rl, PASS+ADD 
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BSUBS 

H#98 

R 로부터 S 바이 트덜 기 

BSUBR 

H#A8 

S 로부터 R 바이 트덜 기 

BINCS 

H#B8 

S 의 바이 트증가 

BINCNS 

H#C8 

부정 S 의 바이 트증가 


H#D8 

R 와 S 의 바이트배 타적론리더하기 


H#E8 

R 와 s 의 바이트론리곱하기 

BOR 

H#F8 

R 와 s 의 바이트론리더하기 

그룹 4 기 능 

CRC 

H#00 

순환여유문자축적 

SEL 

H#10 

S 혹은 R 의 선택 


H#20 

단정 확도길 이 정 규화 


H#30 

배 정 확도길 이 정 규화 

DIVRF 

H#40 

나누기의 나머지값길이고정 

SDIVQF 

H#50 

부호 있 는 나누기 의 상길 이 고정 

SMULI 

■0 

부호 있 는 곱하기반복 

SMULT 

H#70 

부호 있는 곱하기완료 

SDIVIN 

H#80 

부호 있 는 나누기초기 화 

SDIVIS 

■0 

부호 있는 나누기시작 

SDIVI 

H#A0 

부호 있는 나누기반복 

UDIVIS 

H#B0 

부호 없는 나누기시작 

UDIVI 

H#C0 

부호 없 는 나누기반복 

UMULI 

H#D0 

부호 없는 곱하기반복 

SDIVIT 

H#E0 

부호 있 는 나누기 완료 

UDIVIT 

H#FO 

부호 없 는 나누기완료 

그를 5 기 능 

LOADFF 

■F 

나누기 넣 기 / BCD 방아쇠 

CLR 

H#1F 

지 우기 

DUMPFF 

H#5F 

나누기 출구/ BCD 방아쇠 

BCDBIN 

H#7F 

BCD 부호를 2진부호로 변환 

EX3BC 

H#8F 

3 넘 침부호 (Excess_3) 의 바이트교정 

EX3C 

H#9F 

3 넘 침 부호 (Excess_3) 의 단어 교정 

SDIVO 

H#AF 

부호 있는 나누기의 자리넘침검사 

BINEX3 

H#DF 

2 진부호를 3 넘침부호 (Excess 3) 로 변환 

NOP32 

HttFF 

조작없음 


기호번역프로그람은 이것을 2진수로 된 해 당한 기계 어로 번역한다. 명 령의 개별적요 
소들은 다음과 같이 서술할수 있다: 


• CONT 11 는 기 본 NOP 명 령 이 다. 

• 마당 [1 기 은 32 bit 등록기 가 쓰기 되 도록 WELH (쓰기 허 락 ， L 과 비 로 된 다. 

• 마당 [18] 은 SELRFYMX 로 변환되 여 ALU Y MUX 출구로부터 의 반결 합을 








• 마당 [24] 는 목적 등록기 로서 등록기 R 3 을 지 적한다. 

• 마당 [25] 는 원천등록기의 하나로서 등록기 R 2 을 지적한다. 

• 마당 [26] 은 원천등록기의 하나로서 등록기 R 1 를 지적한다. 

• 마당 [2 기은 ALU 의 ADD 연산을 규정한다. ALU 의 밀기회 로명 령은 PASS 이며 
따라서 ALU 출구는 밀기회 로에 의하여 밀기되지 않는다. 

기호표식에 대하여 몇가지 강조되여야 할것이 있다. 우선 련속마당에 대한 번호를 
규정할 필 요가 없 다. 즉 

CONT 11 [17], WELH , [18], SELRFYMX 
가 마당 18 안에 있기때문에 

CONT 11 [17], WELH , SELRFYMX 


로 쓸수 있다. 

다음으로 표 15-9 의 그룹 1에 있는 ALU 명 령들은 늘 그룹 2와 함께 리 용된다. 그룹 
3-5 에 있는 ALU 명 령은 그룹2와 함께 리 용되지 말아야 한다. 

제 5 절. 마이크로프로그람의 응용 

미 이 크로프로그람이 도입 된후 특히 I 960 년대 후반기 에 이 르러서 야 마이 크로프로그 
탐의 응용은 점 차 광범하게 리 용되 게 되 였 다. 19기 년 초에 는 마이 크로프로그람의 리 용이 
뚜렷해 졌다. 현재 마이크로프로그람의 응용을 보면 다음과 갈다. 

콤퓨터의 실현 

• 모의 

• 조작체계지원 

• 전용장치의 실현 

• 고수준언어의 지원 

• 마이크로고장진단 

• 사용자재구성기술(마이크로프로그람을 필요에 따라 다시 짜넣는 기술) 

이 장에서는 콤퓨터실현에 대하여 론의하였다. 마이크로프로그람방식은 조종장치 실 
현을 위한 체 계적 인 기술을 제공한다. 그와 관련된 기술은 모의 이다 [ MALL 75]. 모의는 
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원래 다른 언어로 작성된 프로그람을 실행하기 위하여 하나의 기계에 마이크로프로그람 
을 리 용하는것을 말한다. 모의의 가장 일반적 인 리 용은 한 콤퓨터 에서 해 야 할 일을 다 
른 콤퓨터에서 할수 있게 사용자를 돕는것이다. 이것은 흔히 많은 기계의것을 새 기계에 
서 실행할수 있게 함에 있어서 고객들의 편리를 도모할 목적밑에 제작회사에 의하여 실 
현된다. 한 연구사는 10년이상 물리적인 변화만 하여 온 IBMSYSTEM 1370 이 세상에 나 
온것 은 1983 년 이 였 다고 주장하고 있 다. [ MALL 83] 

마이크로프로그람의 또 한가지 리용은 조작체계에 대한 지원이다. 마이크로프로그람 
은 조작체 계쏘프트웨어 의 중요한 부분들을 교체하는 기 본단위 를 실 현하는데 리 용할수 있 
다. 이 수법은 조작체계의 실현과 조작체계성능개선을 쉽게 할수 있다. 

마이크로프로그람은 주콤퓨터와 결합할수 있는 전용 장치를 실현할수 있는 수단으로 
서 도 쓸모가 있다. 이 에 대 한 대 표적 인 실례 가 자료통신기판이 다. 이 기 판에 는 자체의 극 
소형 처 리 장치 가 장비 되 여 있 다. 그것 은 전용을 목적 으로 하기 때 문에 성 능을 개 선하기 위 
한 쏘프트웨어 를 리 용하는것 이 아니 라 그 기능의 일부를 마이 크로프로그람으로 실현하자 
는것 이 다. 

마이 크로프로그람의 단 하나의 응용분야는 고수준언어지 원이 다. 마이 크로프로그람에 
서는 여 러개 기능들과 자료형 태들을 직접 실현할수 있다. 그 결과는 프로그람을 필요한 
기 계 어 형 태 로 번역 하기 가 쉽 다는것 이 다. 결과적 으로 기 계 어 는 고수준언어 (례 하면 포트란， 
코볼, 에이다)의 요구를 만족하게 해준다. 

마이 크로프로그람은 체 계 오유를 감시 하고 검 사하며 분리 하고 수정하는것 을 지 원하는 
데 리용할수 있다. 이것을 마이크로 진단이라고 하며 체계유지기능(오유없이 동작할수 있 
는 기능)을 강화할수 있다. 이 방법 은 그것 이 검출되 였을 때 체계 가 점 차로 재구성할수 
있게 한다. 례하면 만일 고속다중선택 기 가 비 정상이 면 마이 크로프로그람 다중선택기 가 
대신 동작할수 있다. 

마이크로프로그람응용의 또 하나의 일반적인 분류는 사용자재구성기술이다. 일부 기 
계 들은 쓰기 가능한 조종기억 기 (즉 ROM 보다도 RAM 으로 된 조종기억 기 ) 들을 가지 고 있 
으므로 사용자들은 여기에 마이크로명령모임을 기억해 둔다. 이것은 사용자가 재구성하 
는데 요구되는 응용프로그람에 따라서 기계를 재구성한다. 

마이크로프로그람의 또 하나의 응용은 사용자구성 기술이다. 일부 기계들은 쓰기가능 
한 조종기 억 기 (즉 ROM 보다도 RAM 으로 된 조종기억 기 ) 들을 가지 고 있 으므로 사용자 
들은 여기 에 마이크로프로그람을 써 넣 을수 있다. 일반적 으로 완전히 수평적 이면서 리용 
하기 쉬운 마이크로명 령들이 제공되여 있다. 

이것을 리용하여 사용자는 요구되는 응용프로그람에 따라서 기계를 조종할수 있게 
마이크로프로그람을 다시 짜넣을수 있다. 
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련습문제 

1. 월크스에 의하여 설계된 가상기계 에서 곱하기명 령의 실현을 해설과 흐름도를 리 
용하여 설명하시오. 

2. 다음의 기호형태로 된 마이크로명령이 있다고 하자. 

IF (AC 0 = 1) THEN CAR 수一 (C 0 - 6 ) ELSE CAR (CAR) + 1 
여 기서 AQj 은 축적등록기 의 부호비 트이며 C 0 - 6 은 마이 크로명 령의 첫 6 개의 
비 트이다. 이 마이 크로명 령 을 리 용하여 AC 가 부인 경 우 갈라 지 는(분기 되 는) 분 
기 등록기 덜기 (BRM) 기계명 령 을 실현하는 마이 크로프로그람을 작성 하시 오. 마이크 
로명 령의 비트 CrQ 은 마이크로조작에서 병 렬로 조작되는 비트들이라고 본다. 
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프로그람을 기호로 표시하시오. 

3. 하나의 처 리 장치 가 자기의 명 령주기 에 4 개의 기 본주기 즉 꺼 내기，간접，실행 및 
새치기를 가지고 있다. 하드웨어를 실현함에 있어서 두개의 lbit 기발이 현재 집행 
되는 주기를 지적 한다. 

1. 왜 이 기발이 필요한가? 

L . 왜 이 기발들이 마이크로조종장치안에는 필요 없는가? 

4. 그림 15-7 의 조종장치 를 고찰해 보자. 조종기억 기 가 24 bit 폭이고 마이 크로명 령 형 
식의 조종부분이 두개 마당으로 나뉘여 져 있으며 13 bit 가운데서 하나의 마이크 
로조작마당으로써 수행되 여 야 할 마이 크로조작들을 규정 한다. 

주소선택마당은 기발에 기초한 조건을 규정하는데 이 조건은 마이크로명령의 분 
기를 일으키자는데 있다. 기발은 8 개 이 다. 

자. 주소선택마당안에 얼마만한 비트가 있어야 하는가(주소선택마당이 몇 비트로 
되여야 하는가) 

L . 주소마당은 몇비트로 되여야 하는가? 

조종기억기의 용량은 얼마인가? 

5. 앞의 문제의 조건에서 무조건분기는 어떻 게 수행되는가?분기를 어떻게 피할수 있 
는가(즉 분기，조건 혹은 무조건을 규정하지 않는 마이 크로명 령 을 서 술하시 오)? 

6. 매 개 기계명 령루린을 위하여 8개의 조종단어 가 제공된다고 하자. 기계 명 령조작코 
드가 5 bit 이 고 조종기 억 기 가 1024 단어 를 가진 다면 명 령 등록기 로부터 조종주소등 
록기에로의 배치를 설명하시오. 

7. 부호화된 마이크로명 령형 식 이 리 용된다고 하자. 9 bit 의 마이크로조작마당이 46개 
의서로 다른 동작을 규정하는 보조(부분)마당으로 나뉘여 질수 있다는것을 설명 
하시오. 

8. 16개의 등록기，16개의 론리 및 16개의 산수연산기술을 가진 ALU , 8개의 조작 
을 할수 있 는 밀 기 등록기 , 이 들모두를 내 부처 리 장치모선 에 련결 시 킨 처 리 장치 가 
있 다고 하자. 처 리 장치 가 할수 있는 여 러 가지 마이 크로조작을 규정하는 마이 크로 
명 령형식을 설계하시오. 
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제 5 편. 병렬조직 


제 5 편의 중심 

제 5 편 에 서 는 병 렬 처 리 조직 의 주요부분에 대 하여 고찰한다. 병 렬 처 리 조직 에 서 다 
중처 리 장치 들은 서 로 협 동하여 응용프로그람을 실 행한다. 슈퍼스칼라처 리 장치 는 명 령 
준위에서 병렬실행을 할수 있기때문에 병렬처리조직에서는 다중처리장치에 의 하여 작 
업이 병렬로 그리고 협동적으로 진행되도록 하기 위한 여러준위병렬화를 고찰하게 된 
다. 이 러한 내부조직으로 하여 여 러가지 문제 가 제기된다. 례하면 개개 가 자체의 캐쉬 
를 가지고 있는 다중처리장치들이 같은 기억기에 대한 접근을 공유하자면 하드웨어 
혹은 쏘프트웨어 기구는 두 처 리 장치가 주기억기의 유효영상을 공유해 야 하는데 이것 
을 캐 쉬 일 치 성 문제 라고 한다. 이 설 계 항목과 기 타 문제 를 제 5 편에 서 취 급한다. 

제 5 편의 장별 내용 
제 16 장. 병렬처리 

제 16 장에 서는 병 렬처 리 를 개 괄하였다. 여 기서는 다중처 리 장치 콤퓨터 를 구성 하기 
위한 세가지 방안인 대칭다중처리장치를퓨터，클라스터와 비균일기억기접근 ( NUMA ) 콤 
퓨터 들을 고찰한다. 다중처 려 장치 를 구성 하여 성 능을 높이 기 위 한 두가지 가장 대 표적 
인 방법은 대칭처 리장치와 클라스터를 구성하는것 이다. 비균일기 억기접근체 계는 아직 
광범하게 상업적성과를 달성하지 못하였지만 최근에 가장 중시되는 개념이다. 마지막 
으로 제 16 장에 서 는 벡 토르처 리 장치 의 특수한 구성 에 대 하여 고찰하게 된다. 
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♦ 체계의 성능을 높이기 위한 전통적인 방법은 주어 진 작업부하를 지원하기 
위하여 병렬로 실행할수 있는 다중처리장치를 리용하는것이다. 그가운데서 
가장 대 표적 인 두가지 다중처 리 장치 조직 은 대 칭 다중처 리 장치 조직 과 클라스 
터조직 이다. 최근에 비균일기억기접근체계가 많이 리용되고 있다. 

♦ 대 칭 다중처 리 장치 체 계 는 같은 콤퓨터 안에서 여 러 개의 같은 처 리 장치 들이 모 
선이나 몇가지 종류의 교환체계에 의하여 호상 련결된 구성을 말한다. 대칭 
다중처리장치의 주소화에서 제일 심중한 문제는 캐쉬의 일치성문제이다. 매 
개 처리장치는 자체의 캐쉬를 가지고 있으므로 주어 진 행의 자료가 여러 
개의 캐쉬안에 존재할수 있다. 만일 그러한 행이 한 캐쉬안에서 변화되면 
그때 두개의 주기억기와 다른 캐쉬는 그 행에 대하여 무효인 형식을 취한 
다. 캐쉬 일치성규약은 이 문제를 극복하기 위하여 설계된것 이 다. 

♦ 다중콤퓨터체계는 하나의 자원을 함께 처리할수 있게 여러대의 콤퓨터를 호 
상 련결하여 하나로 묶어 놓은것으로서 마치도 한대의 콤퓨터가 처리하는 
것과 같은 느낌 이 든다. 

♦ 비균일기억기접근체계는 주어 진 처리장치로부터 기억기안의 단어까지 접근시간이 
기 억 단어의 주소에 따라서 변하는 공유기 억기식 다중처 리장치를 말한다. 

♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦♦ 

전통적으로 콤퓨터는 순차기계로 고찰되여 왔다. 대부분의 프로그람작성언어는 프 
로그람작성자가 명령의 순차에 따라서 알고리듬을 규정할것을 요구한다. 처리장치는 
한번에 하나씩 차례로 기계어명령을 실행하는 방법으로 프로그람을 집행한다. 매개 명 
령은 명령꺼내기, 연산수꺼내기，연산수행，결과기억의 순서로 실행된다. 

를퓨터에 대한 이러한 고찰은 완전히 정확한것이라고 볼수 없다. 마이크로조작준 
위에서 다중조종신호를은 같은 시간에 발생된다. 명령관흐름은 최소한 명령꺼내기 
와 연산실행을 동시에 하는것으로 오래전부터 잘 알려 져 있다. 이것들도 둘 다 
병렬로 기능을 수행하는 방식들이다. 이 방식은 후에 명령준위병렬화를 리용한 슈 
퍼스칼라방식 으로 발전하였 다. 슈퍼스칼라기 계는 하나의 처 리 장치 안에 여 러 개의 실 
행장치를 가지고 있으며 따라서 같은 프로그람안에 있는 여러개의 명령을 동시에 
실행할수 있다. 

콤퓨터 기 술이 발전하고 콤퓨터 하드웨 어 의 값이 내 려 감에 따라 콤퓨터 설계 자들도 
성능을 높이기 위하여 일부 경우에 리용가치를 높이도록 더욱더 병렬화를 모색하고 
있다. 이 장에서는 총적 고찰을 먼저 진행 하고 그다음 병 렬화조직의 가장 우수한 방식 
가운데서 세 가지를 고찰한다. 우선 초시기부터 리용되여 현재까지도 가장 대표적 인 병 
렬화의 실례 로 되는 대칭 다중처 리 장치체계를 본다. 대칭 다중처 리장치조직 에는 공통기 
억기를 공유하는 다중처 리 장치들을 리용한다. 여 기서는 캐쉬의 일치성문제 가 제 기된다. 
다음으로 개 별콤퓨터들을 여 러개 협동방식 으로 동작하게 구성 한 클라스터체 계를 서술 
한다. 클라스터체 계는 하나의 대 칭콤퓨터체 계 로서 담당할수 없는 작업 부하를 지 원하는 
일반적인 체계로 점차 리용되고 있다. 마지막으로 고찰하게 되는 다중처리장치리용방 
식은 비균일기 억기접근기계 이 다. 비 균일기 억기접근기 계들은 아직 상대적 으로 생 소하며 
널리 알려 지지 않았지만 대칭처리장치방식과 병렬콤퓨터방식의 우점을 받아 들인것 
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으로 고찰하고 있다. 이 장에서는 또한 백토르를퓨터 에 대 한 하드웨 어조직 방법 에 대 하 
여 보게 된다. 이 방식들은 벡 토르 혹은 류점수의 배 렬을 처 리 하기 위하여 ALU 를 최 
적 화한다. 이것들은 슈퍼콤퓨터 체계를 실현하는데 리 용된다. 


제 1 절. 다중처리장치조직 


1. 병렬처리장치체계의 류형 

Flynu [ FLYN 7 幻 에 의 하여 처 음으로 도입 된 분류방법 은 병 렬 처 리 능력 을 가진 체 
계를 분류하는 가장 일반적인 방법이다. Flynu 은 다음과 같이 콤퓨터체계를 분류할것 
을 제 기하였 다. 

• 단일명령,단일자료 ( SISD ) 흐름: 하나의 처리장치가 하나의 기억기안에 기억된 
자료에 대 한 조작인 하나의 명 령 흐름을 실 행한다. 단일 처 리 장치 들은 이 부류 
에 속한다. 

• 단일명 령，다중자료 ( SIMD ) 흐름: 하나의 기계 명 령 이 여 러개의 처 리요소들의 실 
행을 동시에 조종한다. 매개 처리요소들은 련상자료기억기를 가지고 있으며 
그리하여 매개 명령이 서로 다른 처리장치들에 의하여 각이한 모임자료로 실 
행된다. 벡토르처리장치와 배렬처리장치들이 이 부류에 속한다. 



( NUMA ) 

그림 16-1. 병렬처리장치구성방식의 분류 
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• 다중명 령，단일자료 ( MISD ) 흐름: 자료가 차례 로 여 러개의 처 리 장치 에 로 전송 
되며 개 개의 처 리 장치는 서 로 다른 명 령들을 실행한다. 이 구조는 아직 실현 
되지 못하였다. 

• 다중명 령 , 다중자료 ( MIMD ) 흐름: 여 러개의 처 리 장치 들이 자료에 따라 서 로 
다른 명령을 실행한다. 대칭처리장치, 클라스터 그리고 비균일기억기접근체계 
들이 여기에 속한다. 

MIMD 조직에서 처리장치들은 일반목적으로 리용되며 이 개개의 처리장치들은 해 
당한 자료변환을 수행하는데 필요한 모든 명 령을 수행할수 있다. MIMD 는 처 리 장치 가 
통신하는 방법 에 따라 더 세 분화된다(그림 16-1). 만일 처 리 장치들이 공통기 억기를 공 
유한다면 그때 매 개 처 리 장치 들은 공유기억기 안에 기 억된 프로그람과 자료를 접 근할 
수 있으며 그 기억기를 통하여 서로 통신을 한다. 이러한 체계가운데서 제일 일반적인 
형태는 대칭다중처리장치 체계이며 이에 대하여서는 제 2 절에서 론의한다. 대칭다중처 
리장치체 계 에서 는 여 러 개의 처 리 장치 들이 공유모선 혹은 다른 호상련결기 구에 의하여 
하나의 기 억기 나 완충기억 기를 공유한다. 구별되는 특징 은 기 억기의 임의의 구역 에 대 
한 기억접근시간이 매개 처리장치에서 거의 같다는것이다. 최근에 개발된 체계는 비균 
일기억기 접근으로서 제 5 절에서 서술하였다. 이 구성은 이름이 보여 주는것 처 럼 기 억 
기의 서 로 다른 구역 에 대 한 기 억접근시 간이 비균일기 억기접근처 리 장치 에 따라서 다 
르다는것 이 다. 

독립적인 단일처리장치 혹은 대칭다중처리장치들을 묶으면 클라스터가 될수 있다. 
콤퓨터내 에서의 통신은 고정된 경 로나 망을 통하여 실현된다. 

2. 병렬처리조직 

그림 16-2 는 그림 16-1 에서 보여 준 분류에 따르는 일반구성들을 보여 준것이 
다. 그림 16-2 자는 SISD 의 구조를 보여 준것으로서 여기에는 명령흐름을 처리장 
치 에 제 공하는 몇개의 조종장치 가 있다. 처 리 장치 들은 기 억 장치 로부터 나오는 하나 
의 자료흐름을 조작한다. SIMD 에 는 단일한 명 령흐름을 여 러 가지 처 리 요소들에 공 
급하는 조종장치가 하나 있다. 매개 처리요소들은 자기자체를 위한 기억기를 가지 
고 있거나(그림 16-2 L ) 혹은 공유기억기를 가지고 있다. 마지막으로 MIMD 에서 
는 서로 다른 명령흐름을 그자체의 처리요소에 각각 공급하는 여러개의 조종장치 
가 있 다. MIMD 는 공유기 억기를 가진 다중처리장치체계나 분산기억 기를 가진 다중 
콤퓨터체계이다(그림 16-2 a ). 

대 칭 다중처 리 장치체 계，클라스터체 계，비균일기 억기접근체계 에 대 한 설계인 경우 
물리적 구성，호상련결구조，처리장치들사이의 통신，조작체계 설계 , 응용프로그람기술 
과 관련된 문제들을 비롯하여 복잡한 항목들이 있다. 여기에서는 조작체계설계와 관련 
된 항목을 간단히 소개 하고 주로 구성 에 주목을 돌리 려 고 한다. 
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■P| B) 

CU ： 조종장치 LM ： 국부기억기 PE ： 처리요소 is : 명령흐름 

PU ： 처리장치 MU ： 기억장치 DS ： 자료흐름 

그림 16-2. 선택적인 콤퓨터구조 

1 - SISD , L - SIMD (분산기 억기를 가지는 경우)， t - MIMD (공유기 억기를 
가진)'技- MIMD (분산기 억 기 를 가진) 

제2절. 대칭다중처리장치 

최 근까지 만 하여 도 모든 단일 사용자개 인용콤퓨터 들과 대 부분의 워 크스테 이 션 
( ws ) 에 한개의 일반용극소형 처 리 장치 를 리 용하였다. 성 능에 대 한 요구가 높아 지 
고 극소형처 리장치의 가격 이 계속 낮아 지는데 따라 제작회사들은 대칭 다중처 리장 
치체 계들을 도입 하기 시 작하였다. 대 칭 다중처 리장치체계는 콤퓨터 하드웨 어구성 방식 
과 그 방식에 영향을 주는 조작체계의 동작에 많이 관계된다. 대칭다중처리장치체 
계는 다음과 갈은 특성을 가진 콤퓨터체계로 정의된다. 

• 둘이상의 처리장치들이 있다. 

• 이 처 리 장치 들은 갈은 주기억 기 와 I/O 장치 를 공유하며 모선 혹은 다른 내 
부련결기구에 의하여 호상 련결된다. 기억기접근시간은 매개 처리장치들에 
서 거의 같다. 

• 모든 처리장치들은 갈은 통로 아니면 갈은 장치에 경로를 제공하는 다른 통로를 
통하여 I 八) 장치들에 대 한 접근을 공유한다. 

• 모든 처리장치들은 같은 기능(여기서 대칭성이 라는 의미)을 수행한다. 

• 체계는 일감, 과제，파일，자료요소의 준위에서 처리장치와 프로그람사이 호상작 
용을 제공하는 통합조작체 계 에 의 하여 조종된다. 
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:卜 4 까지는 전체 해설 이 다. 5는 클라스터 와 같이 결합이 강하지 않은 극소형처 리 
장치 와의 대 조관계 를 보여 준것 이 다. 후자인 경 우에 호상작용을 위한 물리 적단위 는 
일 반적 으로 통보문이 나 옹근 하나의 파일 이다. 대 칭 다중처 리 장치체 계 에서 개 별적자료 
요소들은 호상작용을 위한 준위 를 구성할수 있으며 처 리 장치 들사이 에서 는 높은 급의 
호상협동이 진행된다. 

대 칭 다중처 리 장치 의 조작체 계 는 모든 처 리 장치 들에 대 하여 처 리 공정 이 나 스레 드 
( Thread ) 들의 순서를 작성 한다. 대 칭 다중처 리장치체계는 처 리장치가 하나인 극소형 
처리장치체계에 비하여 다음과 갈은 우점이 있다. 

• 성능: 콤퓨터에 의하여 진행되는 작업을 몇개 부분이 병렬로 진행될수 있도록 
구성할수 있다면 그때 다중처 리장치 로 된 체계는 같은 류형의 하나의 처 리장치 
로 된 체계보다 더 큰 성능을 엄을수 있다(그림 16-3). 

• 리용률: 대칭다중처리장치체계에서 모든 처리장치들은 갈은 기능을 수행하기때 
문에 어느 한 처리장치가 고장이 나도 콤퓨터체계는 정지되지 않는다. 그대신 
체계는 성능이 떨어 지지만 동작은 계속할수 있다. 

• 성능제고: 사용자는 처리장치를 보충하는 방법으로 체계의 성능을 높일수 있다. 

• 생 산규모: 제 작자들은 체 계안에 구성 된 처 리 장치 의 수에 따라서 가격 과 성 능에 
서 서로 다른 제품계렬을 만들수 있다. 

시간 - - 

처 리 소자 1 지:^^^^^ 

처리소자 2 ᄃ互쪼그 ^^^^^ 互표표고互空포즈조空 ^^^^^ 

처리소자3 s ' ssy 년^ ^^_ 



이것들은 담보에 의해서 라기보다도 잠재적 인 리 익을 준다는것을 고려하는것 이 중요하다. 
조작체 계는 대 칭 다중처 리 장치체계 에서 병 렬화를 실현하는데 필요한 도구들과 기 능들을 
제공해 주어야 한다. 

대칭 다중처 리장치체계의 매 력적 인 특징은 다중처 리장치들의 존재 가 사용자에 게 명 
백 하다는것 이 다. 조작체 계 는 스레 드나 처 리 공정 에 대 한 처 리 순서 작성 과 처 리 장치 들사이 
동기화에 주의를 돌려 야 한다. 

1. 조직 

그림 16-4 에는 다중처리장치체계의 일반적구성을 보여 주었다. 여기에는 두개 혹은 
그이상의 처리장치들이 있다. 매개 처리장치들은 조종장치， ALU , 등록기들과 캐쉬들로 
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구성되여 있다. 매개 처리장치들은 여러가지 형태의 호상결합기구를 통하여 공유주기억 
기와 I 八) 장치를 접근한다. 처 리장치들은 주기 억기를 통하여 공동자료구역 안에 남아 있는 
통보문과 상태정보들을 서로 통신할수 있다. 또한 처 리장치들이 신호를 직접 교환할수도 
있다. 기억기는 흔히 여러개의 기억블로크에 대한 접근이 다중으로 그리고 동시에 가능 
하도록 구성한다. 일부 구성에서는 매개 처리장치가 공유되여 자체의 특권주기억과 I/O 
통보들을 가질수 있게 되여 있다. 

다중처 리장치의 조직은 다음과 같이 분류할수 있다. 

• 시분할 및 공통모선 

• 다중포구기 억 기 

• 중앙조종장치 



그림 16-4. 여러개의 처리장치를 결합한 다중처러장치의 일반적구성도 

시분할모선 

시 분할모선은 다중처 리체계를 구성 하는데서 제 일 간단한 기구이 다(그림 16-5). 구조 
와 대면부는 기본적으로 모선호상결합을 리용하는 단일처리장치체계와 거의 갈다. 모선 
은 조종선，주소선 그리고 자료선들로 되여 있다. I / O 처리장치들로부터의 직접기억기접근 
( DMA ) 전송을 실 현 하기 위하여 다음과 같은 특징 을 갖추어 야 한다. 

• 주소지 정 : 자료의 원천주소와 목적주소를 결정 하기 위하여 모선에 련결된 모둘 
들을 구별할수 있어 야 한다. 
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• 중재 : 임의의 I / O 모둘은 림시로《주》로서의 기능을 수행할수 있다. 몇개 종류 
의 우선권방식을 리용하여 모선조종에 대한 경쟁요구를 중재 할수 있다. 

• 시분할: 하나의 모둘이 모선을 조종할 때 다른 모선은 조종되지 말아야 하며 관 
건되여 있어 야 한다. 필요하다면 모선접근이 실현될 때까지 조작을 중단한다. 



그림 1^5. 대 칭 다중처 리 소자구성 


단일처리장치의 특징들을 직접 대칭다중처리장치체계에 리용할수 있다. 뒤에서 보게 
되 겠지 만 모선을 통하여 하나 혹은 그이상의 기 억모둘을 접근하는 다중 ]/0 처 리 장치체 계 
와 갈은 다중처 리 장치체 계 들도 있 다. 

모선조직은 다른 조직에 비하여 다음과 같은 우점을 가진다. 

• 간결성 : 다중처 리 장치조직가운데 서 제 일 간단한 방식 이 다. 매 개 처 리 장치 의 물리 
적 대 면부와 주소지 정，중재，시분할론리 는 하나의 처 리 장치 체 계 와 갈다. 

• 유연성 : 모선에 여 러개의 처 리 장치들을 더 련결하는 방법 으로 체 계를 확장하기 
가 일 반적 으로 쉽다. 

• 믿음성 : 모선은 주로 피동매체이므로 여기 에 련결된 임의의 장치에서의 오유는 
체 계전반에 영 향을 주지 않는다. 

모선조직 에서 의 기 본결함은 성 능이 다. 모든 기 억참조는 공통모선을 통하여 진행된다. 
따라서 체 계의 속도는 모선주기시 간의 제 한을 받는다. 성 능을 개선하기 위하여 매 개 처 
리 장치 는 캐 쉬 를 가져 야 한다. 이 것 은 모선접 근회 수를 극히 줄일수 있 다. 전형 적 으로 WS 
와 개인용콤퓨터의 대칭다중처리장치들은 두개 준위로 된 캐쉬를 가지고 있는데 하나는 
Ll(l 준위 )캐 쉬 로서 내부용이 며 다른 하나는 L 2(2 준위 )캐 쉬 로서 내부 혹은 외부용이다. 

캐쉬를 리용함으로써 설계에서는 몇가지 새로운것을 고찰하게 된다. 매개 국부캐쉬 
들은 기 억 기의 일부분을 영상으로 가지 고 있기때 문에 만일 단어 가 한 캐쉬안에서 변화되 
면 다른 캐쉬안에 있는 자료가 무시될수 있다. 이 것을 막기 위하여 다른 처 리 장치들은 
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자료의 량갱신이 일어 나는 것을 감시하여야 한다. 이것을 캐쉬의 일치성문제라 고 하며 
일반적으로 조작체계에 의해서가 아니라 하드웨어에 의하여 진행된다. 이 문제에 대하여 
서는 제 3 절에서 취급한다. 

다중포구기억기 

다중포구기 억기 방식 은 주기억기 에 대 한 접 근을 매 개 처 리 장치 와 입 출력모둘에 의하 
여 직접 그리고 독립적으로 할수 있는 방식이다(그림 16-6). 기억기와 관련된 론리에서는 
충돌문제 를 풀기 위한것 이 반영 되 여 있 다. 충돌을 막기 위 하여 흔히 리 용되 는 방법 은 매 
개 기 억포구에 항구적으로 규정된 우선권을 할당하는것이 다. 특히 매개 포구에서 물리적 
및 전기적대면부는 마치도 하나의 포구들로 된 기억모둘과 같다. 따라서 처 리장치 나 I/O 
모둘을 다중포구기억기에 적응시키는데는 거의 변경 이 필요 없다. 



다중포구기 억기 방식 은 기 억 체 계 에 필 요한 론리 가 매 우 적 은 모선 방식 에 비 하여 더 
복잡하다. 그러나 성능은 더 높은데 그 리유는 매개 처리장치가 개개의 기억모둘에 대응 
하는 통보를 가지고 있기때문이다. 다중포구의 다른 하나의 우점은 기억기의 일부분을 
하나 혹은 여 러 개의 처 리 장치 든가 I/O 모둘에서 전용으로 쓸수 있게 구성할수 있는것 이 다. 
이것은 비 법접 근에 대 한 안전성을 높일수 있으며 다른 처 리 장치 에 의하여 변경할수 없는 
기 억구역안의 회 복루린들을 기 억시 킬수 있다. 

또 다른 한가지 측면은 동시 쓰기 수법 을 캐 쉬 조종에 리용할수 있는데 그 리유는 다 
른 처 리 장치 가 기 억갱 신을 감시 하는 경우 이 보다 더 편리한 수단이 없기때 문이 다. 

중앙조종장치 

중앙조종장치는 개별적 인 모둘 즉 처리장치，기억기， I/O 들사이에 개별적 인 자료흐름 
의 입 출력 을 조종한다. 조종장치 는 요구신호들을 완충하며 중재 와 동기기 능을 수행한다. 
그리 고 처 리 장치 들사이 에 상태정 보나 조종정 보를 통과시키 며 캐쉬의 갱 신을 감시한다. 
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다중처리장치의 조직을 조종하는 모든 론리들은 중앙조종장치안에 집중되여 있기때 
문에 VO , 기억기와 처리장치와의 대면부는 그대로 남아 있다. 이것이 모선방식의 대면부 
에 유연성과 간결성을 준다. 이 방식의 기본결함은 조종장치가 매우 복잡한것인데 이것 
은 성능을 높이는데서 잠재적 인 난점으로 되고 있다. 

이 중앙조종장치의 구조는 IBM S/370 계렬과 같은 다중처리장치로 된 대형를퓨터에 
리용되 였 다. 이 러 한것 은 오늘날 드물게 볼수 있 다. 

2. 다중처리장치를 위한 조작체계설계에 대한 고찰 

대 칭 다중처 리 장치 (SMP) 를 위 한 조작체 계 는 사용자가 체 계 자원을 조종하는 단일 조작 
체계를 쓰는것처럼 인식하도록 처리장치와 다른 콤퓨터의 자원을 관리한다. 사실상 이러 
한 구성은 마치도 단일처리장치-다중프로그람체제처럼 인식된다. 대칭 병렬처리장치와 단 
일처리장치의 두 경우에 다중일감이나 프로쎄스믈숀 한번에 처리될수 있으며 그것들의 
실 행순서 를 규정 하고 자원을 할당하는것 은 조작체 계 가 할 일 이 다. 사용자는 하나의 처 리 
장치 가 하든 여 러개의 처 리 장치 가 하든간에 관계 없 이 다중프로쎄스나 프로쎄스안의 다중 
스레 드들을 리용하는 응용프로그람을 작성할수 있 다. 따라서 다중처 리 장치 조작체 계 는 다 
중프로그람체계의 모든 기능과 다중처 리장치 에 적 합한 특징들을 갖추고 있어 야 한다. 기 
본설 계항목은 다음과 갈다. 

• 동시병행처리: OS 루린들은 여러개 처리장치들이 갈은 IS 코드들을 동시에 실행 
하게 하는것 이 다. OS 의 갈은 부분과 서 로 다른 부분을 실 행하는 다중처 리 장치 
들을 리용하여 중지 상태 라든가 무효조작을 피 하기 위하여 OS 의 표들과 관리 구 
조들을 일정하게 관리하여 야 한다. 

• 처러순서작성: 처 리순서 작성은 처 리장치 에 의 하여 수행된다. 그래 야 충돌을 피 할 
수 있다. 순서작성기는 준비된 프로쎄스장치들을 필요한 처 리장치에 제공한다. 

• 동기 화: 공유주소공간이 든가 공유 !/ O 자원에 대 한 잠재 적 인 접 근을 하는 다중능 
동처 리 장치 에 있어서 효과적 인 동기화에 주의를 돌려야 한다. 동기화는 호상복- 
점적으로 사건이 처 리되게 순서를 결정하는 기구이 다. 

• 기 억관리 : 다중처 리장치체계 에서 기 억관리는 제 7 장에서 론의된것처 럼 단일처 리 
장치 기계 에서 고찰한 모든 항목들을 취 급하여 야 한다. 그외 에 조작체 계 는 최 대 
의 성 능을 얻 기 위하여 다중포구기 억 기 와 같은 필 요한 하드웨 어병 렬 화를 리용하 
해 야 한다. 서 로 다른 처 리 장치 에 대 한 페지 화기구는 여 러개의 처 리 장치들이 페 
지 와 토막을 공유할 때 일 치성의 실현과 페지교체 를 조종한다. 

• 믿 음성 과 오유조종 : 조작체 계 는 처 리 장치오유에 따르는 성 능저 하를 막아야 한다. 
순서작성 기 와 조작체 계 의 다른 부분들은 처 리 장치 의 오유를 인식 하고 그에 따라 
관리표들을 재 구성하여 야 한다. 

3. 대칭다중처리장치로 된 대형콤퓨터 ( SMP ) 

대 부분의 개 인용를퓨터 들과 대 칭 다중처 리 장치 로 된 워 크스레 이 션 (WS) 은 그림 16-5 
에서 제시한것처럼 모선호상결합방식을 리용하고 있다. 여기서는 최근에 개발된 IBM 
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S/390 대형콤퓨터계렬에 리용되고 있는 한가지 방안에 대하여 보기로 하자 [MAK97]. 그 
림 16-7 은 S/390 대 칭 다중처 리 장치방식의 전반적구성 을 보여 주었다. 이 계 렬의 체 계들 
은 하나의 주기억 기 판으로 된 단일 처 리 장치 로부터 10 개 의 처 리 장치 와 4 개 의 기 억 기 판으 
로 구성된 고성능체계 까지 가지고 있다. 여기 에는 VO 처 리 장치 로서의 기능을 수행 하는 
처 리 장치 가 한두개 더 보충된다. 이 체계구성의 기본요소들은 다음과 갈다. 

• 처리장치 ( PU ): 이것은 CISC 극소형처리장치로서 가장 많이 쓰이는 명령은 장치 
배선론리 식으로 되여 있으며 나머지는 마이크로프로그람방식으로 실행된다. 매 
개 처 리 장치 에 는 64KB 의 1 준위 캐 쉬 가 내 장되 여 있 으므로 접 근할수 있 다. 

• L 2(2 준위)캐쉬 : 매개 2 준위캐쉬는 용량이 384KB 이다. 2 준위캐쉬들은 두개씩 
짝을 무어 배 치되 여 있으며 매 개 짝은 세개의 처 리 장치를 지 원하며 한편으로 전 
체주기 억공간을 접근할수 있다. 

• 모선교환망다리 (BSN): 이 다리는 L2 캐쉬와 주기 억을 련결시 킨다. 매개 모선교 
환망다리 는 2MB 크기 의 3 준위 (L3) 캐 쉬 를 내 장하고 있 다. 

• 기억기판 : 매개 기판의 기억용량은 8GB 이며 전체 용량은 32GB 이다. 

S/390 대 칭 다중처 리 장치 구성 에 는 흥미 있는 몇 가지 특징 이 있 다. 그에 대 하여 차례 
로 보기로 하자. 

• 전환호상교환결합 

• 2 준위 (L2) 공유캐 쉬 

• 3 준위 (L3) 캐 쉬 




■ 


■ 


■ 



PU : 처리장치 
L 2： 2차캐 쉬 
BSN ： 모선절환 


그림 16-7. IBM S /390 SMP 구성 
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절환호상결합 

PC 와 WS 를위한 대칭다중처리장치체계에서는 하나의 공유모선을 공동으로 리용한 
다(그림 16-5). 단일모선을 이렇게 배렬하면 설계의 스칼라성에 영향을 주는 어려운 문 
제 가 제 기된다. S /390 에서는 이 문제를 두가지 방법 으로 해 결하였다. 첫째 로, 주기억을 
4 개의 기판으로 나누고 그 개개에 기억기접근을 고속으로 조종할수 있는 자체의 기억조 
종장치를 넣 었다. 이렇게 하면 주기억에 대 한 평균전송부하는 1/4 로 줄어 드는데 그 리 
유는 기억기를 4개의 부분으로 나누고 4개의 독립적인 통로에 련결시켰기때문이다. 둘째 
로，처 리장치들로부터 (실제로는 L 2 캐쉬로부터) 하나의 기억기관까지의 련결은 공유모선 
의 형 태 로가 아니 라 오히 려 지점 대 지점련결이며 개 개의 통로 L 2 캐쉬를 통하여 세 개의 
처 리 장치 로 된 그룹을 모선교환망다리 에 련결한다. 모선교환망다리 는 차례 로 5개의 통로 
(4 개의 L 2 통로，한개의 기 억기판)안의 자료를 절환할수 있는 스위 치의 기능을 수행한 
다. 

4 개의 L 2 통로에 대 하여 모선교환망다리는 4 개의 물리적통로를 하나의 론리자료모선에 
련결한다. 따라서 4개의 L 2 통로가운데서 어느 한 통로로 들어 오는 신호는 나머지 세개 
의 L 2 통로로 되돌아 오게 된다. 이 특징은 캐쉬의 일치성을 지원한다. 

주의해야 할것은 비록 4 개의 개별적인 기억기판이 있다고 하여도 매개 처리장치와 
L 2 캐쉬는 주기억쪽으로 두개의 물리적포구들만 가진다는것 이 다. 그 리유는 매개 L 2 캐쉬 
는 오직 주기억기의 절반으로부터 자료를 꺼내여 보관하기때문이다. 주기억전체를 봉사 
하는데 두개의 캐쉬를 쓰며 매개 처리장치는 쌍으로 두개의 캐쉬에 련결하여야 한다. 

공유 L 2 캐쉬 (2 준우 I 공유캐수 I ) 

대 칭 다중처 리 장치 체 계 에 쓰이 는 전형 적 인 2 준위 캐 쉬 방식 에 서 매 개 처 리 장치 는 전용 
LI , L 2 캐쉬를 가지고 있다. 최근에 L 2 캐쉬에 대 한 흥미는 더욱더 높아 지고 있다. 3세 
대로 알려 진 S /390 대칭다중처리장치의 초기 판본에서 벌써 IBM 은 전용 L 2 캐쉬를 리 용 
하였다. 4 세대 와 5세대의 판본에서는 공유 L 2 캐쉬 가 리 용되 였다. 다음의 두가지 고찰은 
이 변화를 보여 준다. 

• 3 세대로부터 4 세대에로 발전하면서 극소형처리장치의 속도는 두배로 증가되였 
다. 만일 3세대가 유지되였다면 모선전송속도에서 커 다란 변화가 일어 났을것 이 
다. 갈은 시기에 3 세대때의 구성요소들을 될수록 리용하려고 하였다. 모선에서 
큰 발전이 없으면 모선교환망다리들이 난점으로 될것이다. 

• 일 반적 인 S /390 의 작업 량에 대 한 분석 은 처 리 장치 들속에 서 명 령 과 자료에 대 한 
큰 몫을 할당한다. 

이상의 고찰에 기초하여 4세대 S /390 설계집 단은 매개 완충기가 하나이상의 L 2 캐쉬 
를 리용하며 다중처 리 장치 들에 의하여 공유되 여 야 한다는것 을 제 기하였 다 (그리 고 매 개 
처 리장치는 소편안에 L 1 캐쉬를 전용으로 가지고 있다.). 얼핏보면 L 2 하드웨어를 공유하 
는것이 잘못된것처럼 보인다. 그것은 처리장치가 기억기에 접근할 때 L 2 캐쉬를 걸쳐야 
하므로 더 속도가 떠지는것으로 보이기때문이다. 그런데 사실상 많은 량의 자료가 다중 
처 리 장치 에 의하여 공유될 때 공유캐 쉬 가 있 으면 그것 을 방해하는것 이 아니 라 오히 려 전 
체 처 리 량이 늘어 난다. 공유기억기 안에서 공유되거 나 검색되는 자료들은 모선을 통한 
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자료보다 훨씬 더 빨리 접근할수 있다. 

4 세대 S /390 설계 에 의하여 고려된 한가지 방법은 모든 처 리장치들이 공유리용하는 하 
나의 큰 캐 쉬문제 이 다. 한편 보다 캐쉬 를 통하여 체 계의 성능을 개선하려 면 설계 방법 에 
서 현행체계모선조작을 완전히 다시 하지 않으면 안되게 된다. 그러나 성능해석이 보여 
주는바와 같이 현존 BSN 모선의 개개 에 공유캐쉬를 도입하면 이 에 의한 성능에서의 우점 
은 크게 나타나지만 한편으로는 모선통과량이 줄어 든다. 공유되는 캐쉬의 값은 성능측 
정 에 의 하여 확인되 였는데 이것은 3 세대 [ MAK 9 기에 리용된 전용캐쉬 방식보다 공유캐쉬 
가 훨 씬 더 캐 쉬 명 중률 이 개 선되 였 다는것 을 보여 주었 다 [례 NAYF 96]. 

L 3(3 준우 I )캐쉬 

S /390 대 칭 다중처 리장치체계의 다른 특징의 하나는 제 3 준위의 캐쉬 ( L 3) 를 쓴것 이 다 1 2 . 
L 2 캐쉬는 BSN 에 배 치 되 여 있으므로 개개의 L 3 캐쉬 는 L 2 캐쉬 와 기 억기 판사이의 완충을 
보장한다 . L 3 캐쉬는 접근하는 처리장치의 L 1 캐쉬와 L 2 캐쉬에 들어 있지 않는 자료에 대 
한 도달시 간을 줄일수 있다. 이것은 접근된 캐쉬 행 이 다른 처 리 장치 에 의하여 이미 공유 
되 였지 만 접 근처 리 장치 에 대 해서 는 아직 리 용된적 이 없었다면 주기억 기 보다 훨씬 더 빨 
리 자료를 접근할수 있다. 

표 16-1 은 심각한 기억 및 모선부하를 가진 표준 S /390 의 작업부하에 따르는 3 준위 
캐 쉬 로 장비 된 대 칭다중처리 장치 체 계 의 성 능결과를 보여 주고 있 다 [ DOET 97] 2 . 기 억 기 접 
근위반은 캐 쉬 층에 대 한 요구와 처 음으로 복귀 된 16 bit 자료블로크사이 의 지 연시 간이 다. 
L 1 캐쉬는 명중률이 89% 이며 기 억기참조의 나머지 11% 는 L 2, L 3 과 주기 억기준위들에서 
보장된 다. 11% 가운데 서 5% 는 L 2 준위 에 서 해 결된 다. 3 준위 캐 쉬 를 리 용함으로써 기 억 기 참 
조는 불과 3% 에 해 당된다. 세번째 준위 가 없으면 주기억기접근은 배 로 늘어 나게 된다. 


표 16-1. S/360 SMP 조직 에서 캐쉬명중률 


기 억 기 보조체 계 

접 근위 반 (PU 주기 ) 

캐 쉬 크기 

명중률 (정) 

L 1 캐 쉬 

1 

32 KB 

89 

L 2 캐 쉬 

5 

256 KB 

5 

13 캐 쉬 

14 

2 MB 

3 

기억기 

32 

8 GB 

3 


제 3 절. 캐쉬일치성과 MESI 규약 

현대 다중처 리 장치 체 계 에 서 는 매 개 처 리 장치 와 련결된 하나 혹은 두개 준위의 캐 쉬 
를 가지는것 이 관례로 되여 있다. 이 구성은 본질상 성능을 높이기 위한것 이 다. 그러나 
여기에서 제기되는것은 캐쉬일치 성문제이다. 이 문제의 본질은 서로 다른 캐쉬에 갈은 


1 IBM 의 문헌들은 이 캐쉬를 L 2.5 케쉬 라고 한다. 사실상 이 캐쉬는 완충기의 세번째 준위로 구성 하기 
때문에 이 용어로 특별한 우점 이 없는것 같다. 

2 자료는 설치된 L 2 캐쉬들은 리용하는 G 3 체계 에 대 한 것 이 다. 그러 나 결과는 G 4 와 G 5 S /390 들에서 찾 
아볼수 있도록 공유 L 2 캐쉬 들에서 기 대되 는 성 능에 대 해 암시해준다. 
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자료를 동시에 여러개 복사할수 있거나 처리장치들이 자기의 캐쉬에 대한 복사를 자유롭 
게 갱신하는것을 허락하는 경우 기억기의 불일치성문제가 생길수 있다는것이다. 이미 제 
4장에 서 쓰기 에 대 한 가장 일 반적 인 두가지 방안을 정 의하였 다. 

• 비동시쓰기 (Write back ) : 쓰기 조작은 오직 캐 쉬 에서 만 진행된다. 주기 억 기 는 대 
응하는 캐쉬의 행이 캐쉬로부터 지워 질 때만 갱신된다. 

• 동시 쓰기 (Write through ) : 모든 쓰기 조작은 캐 쉬 만이 아니 라 주기 억 기 에 대 하 
여서도 진행된다. 여기서 주기 억기는 항상 유효이라는것을 확인하여 야 한다. 

여기서 명백한것은 비동시쓰기방안에서 불일치성이 생길수 있다는것이다. 만일 두개 
의 캐쉬가 같은 행을 가지고 있고 그 행이 어느 한 캐쉬안에서 갱신되면 다른 캐쉬는 무 
효값을 가진다. 그다음의 읽기에서 무효인 행이 무효인 결과를 낳게 된다. 동시쓰기에서 
조차 다른 캐쉬가 기 억기읽 기쓰기를 하지 않거 나 행 에 대 한 갱 신통지를 직접 받지 못하 
면 불일치가 생길수 있다. 

이 절에서는 캐쉬의 일치성문제에 대한 여러가지 해결방법을 간단히 고찰하고 그 
가운데 서 가장 널 리 리용되 는 MESI 규약에 대 하여 집 중적 으로 고찰한다. 이 규약은 
Pentium 과 PowerPC 를 실 현 하는데 리 용되 였 다. 

임의의 캐쉬 일치성규약의 목적은 같은 시 간에 여 러개의 캐쉬안에 존재 하는 공유변수 
의 일치성을 유지하기 위한 규약을 리용하는 한 가장 최근에 리용된 국부변수들이 여러 
차례의 읽기와 쓰기를 하여도 거기 에 유지되게 하자는데 있다. 캐쉬일치성을 해결하는 
방법 에 는 일 반적 으로 쏘프트웨 어 방법 과 하드웨 어 방법 이 있 다. 일부 실현에 서 는 하드웨 어 
와 쏘프트웨어 요소들을 배 합한 방법 도 리용하고 있 다. 쏘프트웨 어방법 과 하드웨 어방법으 
로 분류하는것은 캐쉬일치성을 고찰하는데서 여전히 유익하면서도 흔히 리용되는 분류방 
법이다. 

1. 쏘프트웨어해결방법 

쏘프트웨어적 으로 캐쉬일 치성 문제를 해 결하기 위한 방안은 하드웨 어회 로들과 론리 
회로들을 더 보충함이 없이 이 문제를 콤파일러와 조작체계에 의거하여 취급하자는것 이 
다. 쏘프트웨 어방법은 잠재적 인 문제들을 검 사하는데 드는 전체 비 용이 실행시 간이 아니 
라 를파일시간으로 반영되며 설계의 복잡성을 피하기 위하여 하드웨어가 아니라 쏘프트 
웨어로 한다는데 그 매력 이 있다. 다른 한편 를파일시간 즉 쏘프트웨 어방법은 일반적으 
로 케쉬를 리용함에 있어서 비효과적이라는 심각한 문제가 제기된다. 

콤파일러에 기초한 일치성기구들은 어느 자료항목들을 보관할 때 불안전하게 될수 
있겠는가를 결정하기 위하여 코드를 해석하고 그에 따라 그 항목들을 표식한다. 조작체 
계 혹은 하드웨어는 그때 보관할수 없는 항목들이 보관되는것을 금지시킨다. 

제 일 간단한 방법은 임의의 공유자료변수들이 보관되는것을 금지시키는것 이 다.이것 
은 낡은 방법으로써 공유자료구조가 일정한 주기기간은 독점적으로 리용되며 다른 주기 
기간에는 효과적으로 읽기만을 할수 있기때문이다. 이것은 적어도 하나의 프로쎄스가 하 
나의 변수를 갱신하거나 적어도 다른 하나의 프로쎄스가 캐쉬일치성이 확인된 변수를 접 
근하는 기 간에만 유효하다. 
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보다 효과적인 방법은 공유변수들에 대한 안전주기를 결정하기 위하여 코드를 해석 
하는것 이다. 그때 콤파일러는 명령을 림 계주기기간 캐 쉬 일치 성을 실 현 하기 위 해 발생 시 
킨 코드에 삽입하는것이다. 해석을 진행하여 그 결과를 실행하기 위한 여러가지 수법들 
이 개발되고 있다. [ LILJ 93] 과 [ STEN 9 이을 참고하시오. 

2. 하드웨어해결방법 

하드웨 어적 인 해결방법을 일반적 으로 캐쉬일치성규약이 라고 한다. 이 해결방법은 
잠재적인 불일치성조건들의 실행시간을 동적으로 인식하게 하는것이다. 문제가 실지 
로 발생했을 때만 취급되므로 보다 더 효과적으로 리용할수 있으며 결과적으로 쏘프 
트웨어방법보다 성능을 더 높일수 있다. 또한 이 방법은 프로그람작성자나 콤파일러 
가 쉽게 리해하므로 쏘프트웨어개발부담을 줄일수 있다. 

하드웨어방법들은 자료행에 대한 상태정보를 어디에서 취하며 그 정보를 어떻게 
구성하며 일치성을 어디에서 실현하며 그를 위한 기구를 어떻게 구성하는가 하는 일 
련의 문제에서 차이가 있다. 일반적으로 하드웨어방법은 등록부규약과 엿보기규약으 
로 분류된다. 

등록부규약 

등록부규약들은 행에 대한 복사가 준비되 여 있는 장소에 대 한 정보를 수집 하고 유 
지하는것이다. 특히 여기에는 주기억조종기의 한 부분인 집중조종장치와 주기억안에 기 
억된 등록부가 있다. 등록부에는 여러가지 국부집중조종장치와 주기억안에 기억된 등록 
부가 있다. 등록부에는 여 러 가지 국부의 내 용들에 대 한 총체적 인 상태정보가 들어 있다. 
개 별적 인 캐 쉬 조종장치 가 요구를 제 기 하면 집 중조종장치 는 기 억 기 와 캐 쉬 들사이 에 서 혹 
은 캐쉬들자체의 사이에서 자료전송에 필요한 지령을 검사하고 출구한다. 이 장치는 또 
한 상태정보를 갱신할 때까지 유지하여야 할 의무를 지니고 있다. 따라서 행의 총체적인 
상태에 영향을 줄수 있는 매개 국부동작상태를 중앙조종장치에 통보하여야 한다. 

특히 조종장치는 처리장치가 어느 행을 복사하였는가에 대한 정보를 유지하고 있다. 
처 리장치는 행에 대한 국부복사를 하기전에 조종장치로부터 행에 대한 독점적접근을 요 
구하여야 한다. 이 폭점적접근을 허락하기전에 조종장치는 이 행에 대한 캐쉬된 복사를 
가지 고 있는 모든 처 리장치 에 통보문을 보내며 매 개 처 리장치 가 그 복사를 무효화하게 
한다. 그러한 매개 처리장치로부터 다시 응답을 받은 다음 조종장치는 요구를 제기한 처 
리장치 에 대하여 독점적 인 접근을 허 락한다. 다른 처 리장치가 또 다른 처 리장치 에 독점 
적으로 허락된 행을 읽으러고 할 때에는 조종장치에 실패신호를 보내게 된다. 그 다음 
조종장치는 그 행을 유지하는 처리장치에 지령을 줄력하여 처리장치가 주기억기에 비동 
시쓰기를 하도록 한다. 그 행은 읽을 때 원천으로 되는 처리장치와 요구하는 처리장치에 
의 하여 공유될수 있다. 

등록부규약들은 여 러개의 캐쉬조종장치 와 중앙조종장치사이 에 통신과잉과 갈은 난 
점을 초래한다. 그러나 이 규약들은 다중모선체계나 다른 복잡한 호상련결체계를 가진 
대규모체계에서 매우 효과적이다. 
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엿보기규약 

엿보기규약은 다중처리장치안의 모든 캐쉬장치에서 캐쉬일치성을 유지하기 위한 작 
업을 분산하는 규약이다. 캐쉬는 자기가 취한 행이 다른 캐쉬와 공유되여 있다는것을 인 
식하여야 한다. 공유캐쉬의 행에 대한 갱신이 진행되였을 때 통보기구에 의하여 다른 모 
든 캐쉬 에 그것을 알려 주어 야 한다. 매개 캐쉬조종장치들은 알려 주는 통지를 감시 하며 
그에 따라 즉시 에 반응하기 위 하여 련결망에 대 한 엿보기를 진행 한다. 

엿보기규약은 리상적으로 모선에 기초한 다중처리장치체계에 맞는다. 왜냐하면 공유 
모선이 통지 와 엿 보기 하는데 서 제 일 단순한 수단으로 되기 때문이 다. 그러나 국부캐 쉬 를 
리 용하는 목적의 하나는 모선접근을 피 하는것과 통지 와 엿 보기를 위 하여 요구되는 모선 
에 대 한 통신량의 증대가 국부캐쉬의 리용으로 하여 엄 어 지는 리득을 떨구지 않게 하자 
는것 이 다. 

엿보기규약에 대하여 두가지 기본방법 인 쓰기-무효규약과 쓰기-갱신(혹은 쓰기-통 
보)규약이 있다. 쓰기-무효규약에서는 읽는 측은 여럿일수 있지만 쓰는 측은 다만 하나 
이다. 처음에 읽기를 위하여 한행을 여러개의 캐쉬들이 공유한다. 캐쉬들가운데서 어느 
하나가 행에 대한 쓰기를 하려고 할 때 먼저 다른 캐쉬 안의 그 행 이 무효라는 통지를 보 
내 여 쓰기 하는 캐쉬 가 독점적 이 되게 한다. 

일단 그 행이 독점적이 되면 처리장치는 다른 처리장치들이 같은 행을 요구할 때까 
지 국부적인 쓰기를 한다. 

쓰기-갱신규약에서는 여러개의 쓰기 혹은 읽기측이 있을수 있다. 처리장치가 공유된 
행을 갱 신하려 고 할 때 갱 신하려는 단어는 다른 모든 처 리장치들에 분배되며 캐쉬들은 
그에 대한 갱신을 계속한다. 

이 두 방안은 모든 환경에서 다른 방안들에 비 하여 다 우수한것은 아니 다. 성능은 
국부캐쉬의 수와 기억기읽기와 쓰기의 패턴에 관계된다. 일부 체계들은 쓰기-무효와 쓰 
기-갱 신의 과정을 둘다 가진 적 응형규약들을 리용하고 있다. 

쓰기 - 무효방식 은 Pentium II , PowerPC 와 같은 상품화된 다중처 리 장치체 계 에서 가 
장 널리 리용되고 있다. 여기서는 캐쉬꼬리표에 비트를 더 추가하여 변경，독점, 공 
유，무효에 따라 매개 캐쉬행의 상태를 표시한다. 이러한 리유로 하여 쓰기-무효규약 
을 MESI 라고 부론다. 이 미 제 4 장에 서 1 준위 와 2 준위 국부캐쉬사이 의 조종을 취 급 
하면서 MESI 에 대 하여 보았다. 이 절의 뒤 에서 는 다중처 리 장치 를 통하여 국부캐쉬안 
에 서 이 규약의 리용을 고찰하기 로 한다. 설명 을 간단히 하기 위하여 같은 시 간안에 
분산된 다중처 리 장치들을 통한 조종과 동시 에 1준위와 2준위 를 둘 다 국부적 으로 조 
종하는것과 갈은 기구는 취급하지 않는다. 이것은 그 어떤 새로운 원리는 아니지만 
론의 에 서 복잡해 질수 있기때 문이 다. 

3. MESI 규약 

MESI 규약에서 자료캐쉬는 매개 행 이 4 개 상태 가운데서 어느 한 상태에 있도륵 매 
개 꼬리 표에 두개 의 상태비 트를 할당하고 있 다는것 을 제 4장에 서 보여 주었 다. 

• 변경 : 캐쉬안의 행은 주기억과는 달리 변경되며 이것은 이 캐쉬에서만 가능하다. 
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그림 16-8. MESI 상태 동작 

n - 기동처리장치에서 캐쉬의 행， l - 전용캐쉬의 행 
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• 다른 캐쉬가 독점적상태에서 행에 대한 복사가 명백하면(기억기로부터 읽기한 
후에 변경이 없었다면) 이 행을 공유했다는것을 가리키는 신호는 복귀된다. 그 
다음 응답하는 처 리 장치는 독점적상태 로부터 공유상태 로 자기의 복사상태를 전 
이하며 발화하는 처리장치는 주기억기로부터 행에 대한 읽기를 하고 그 캐쉬안 
의 행을 무효상태로부터 공유상태로 전이한다. 

• 하나이상의 캐쉬공유상태에서 행에 대한 복사가 명백하면 그들의 개개는 모선 
을 공유했다는 신호를 내보낸다. 발화하는 처리장치는 그 행을 읽으며 그 캐쉬 
안의 행은 무효상태로부터 공유상태 에로 전이 한다. 

• 하나의 다른 캐쉬가 행에 대한 복사를 변경하였다면 그때 그 캐쉬는 읽기를 차 
단하고 공유모선을 통하여 요구하는 캐쉬에 행을 제공한다. 그 다음 응답하는 
캐쉬는 그 행을 변경상태로부터 공유상태로 바꾼다. 3 

• 다른 캐쉬가 행을 복사하지 않고 있으면 그때 신호는 복귀되지 않는다. 발화하는 
처리장치는 행을 읽고 3 그 캐쉬의 행을 무효상태로부터 독점상태에로 전이한다. 


읽기명중 

국부캐 쉬 에서 현재 행 에 대 한 읽 기 가 명 중하였 다면 처 리 장치 는 필요한 항목을 간단 
히 읽는다. 상태변화가 없으면 변경，공유 그리고 복점상태가 유지된다. 


쓰기실패 

국부캐쉬에서 쓰기가 실패하였을 때 처리장치는 실패한 주소가 들어 있는 주기억기 
의 행을 읽기 위하여 기억기읽기조작을 시작한다. 이를 위하여 처리장치는《변경을 하 
려는 읽기》라는 의미에서 RWITM 이라는 신호로 모선에 내보낸다. 행이 넣어 졌을 때 
그것은 즉시 에 변경 을 표식한다. 다른 캐 쉬 에 대 하여 자료의 행 에 넣 기를 위한 두가지 
방법론이 준비되고 있다. 

첫번째 방법론은 일부 다른 캐쉬가 이 행에 대한 변경된 복사를 한다. 이 경우 처리 
장치는 다른 처리장치가 행에 대한 변경된 복사를 한다는것을 발화처리장치에 알린다. 
발화처 리 장치 는 모선을 넘 겨 주고 대 기한다. 다른 처 리 장치 는 모선에 대 한 접 근권을 얻 
어 변경된 캐쉬행 을 도로 주기억기 에 써넣 으며 캐쉬행의 상태 를 무효상태 로 전이한다. 
(그것은 발화처리장치가 이 행을 변경시키고 있기때문이다.) 다음으로 발화하는 처리장 
치 는 다시 RWITM 의 모선상태신호를 출력 하고 그다음 주기억 기 로부터 행 을 읽 으며 캐 
쉬의 행 을 변경 하고 변경된 상태 를 행 에 표시하는 단계 를 차례 로 수행한다. 

두번째 방법 론은 요구되 는 행 에 대 해 복사를 변경하지 않는것 이 다. 이 경 우에 신호 
는 복귀되지 않으며 발화된 처 리장치는 행안에서 읽 기를 진행 하고 그것을 변경한다. 이 
기 간 하나 혹은 그이 상의 캐 쉬 가 공유상태 에 있 으면서 행 에 대 한 복사가 명 백하다면 매 
개 캐쉬는 그 행에 대한 복사를 무효화한다. 하나의 캐쉬가 독점적상태에서 행에 대한 
복사가 명 백하다면 행 에 대 한 복사는 무효화된 다. 


3 일부 실행들로하여 캐쉬는 변경상태의 행신호들을 초기화처리장치에서 진행한다.한편 처리장치는 변 
경상래의 복사가 모선을 리용함으로하여 주기 억기다음상태에서 변경상태의 행쓰기를 하며 변경상태로 
부터 공유상태의 캐쉬 에 행을 전이한다. 점 차 처 리 장치는 재실행을 요구하며 하나 혹은 그이상의 처 리 
장치가 앞서 말한바와 같이 공유상태에서 행복사를 진행한것을 탐색한다. 
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쓰기 명중 

국부캐쉬 안에서 현재 행 에 대 한 쓰기 가 명중했다면 그 효과는 국부캐쉬 안의 그 행 
의 현재상태에 관계된다. 

• 공유: 갱신이 진행되기전에 처리장치는 행에 대한 독점적소유권을 얻어야 한다. 
처리장치는 모선에 그를 위한 신호를 보낸다. 그 캐쉬 안에서 행에 대한 복사가 
공유된 매개 처리장치들은 공유상태로부터 무효상태에로 상태전이를 한다. 이때 
발화된 처리장치는 갱신을 진행하며 공유상태로부터 변경상태에로 행에 대한 
복사를 전 이 한다. 

• 독점 : 처 리장치는 이미 이 행에 대한 독점적조종상태에 있으므로 갱신을 간단히 
수행하며 행에 대한 복사를 독점적 인 상태로부터 변형된 상태에로 전이한다. 

• 변경 : 처리장치는 이미 이 행에 대한 독점적조종상태에 있으므로 그 모선은 변 
경상태로 표식되여 있으며 갱신을 간단히 수행할수 있다. 

1 준위(니)-2 준위 ( L 2) 캐쉬일치 

이미 같은 모선이나 다른 대칭다중처리장치체계의 호상련결기구에 련결된 캐쉬 
들사이의 호상협조동작의 견지 에서 캐쉬일치성규약을 서술하였다. 특히 이 캐쉬를은 
2준위 ( L 2) 캐쉬이며 매개 처리장치는 또한 모선에 직접 련결하지 않으며 따라서 엿보 
기규약에 들어 있지 않는 1 준위 ( L 1) 캐쉬 를 가지 고 있다. 따라서 일 부 방안들은 두 
준위의 캐쉬를 통하여 그리고 대칭다중처리장치조직 안의 모든 캐쉬들을 통하여 자료 
를 보존하여 야 한다. 

중요한것은 MESI 규약(혹은 임의의 일치성규약)을 L 1 캐쉬애까지 확장하는것 이 다. 
따라서 L 1 캐 쉬안의 모든 행 은 상태 를 표현하는 비 트들을 포함하고 있 다. 그 목적 은 다 
음과 같다. L 2 캐쉬 와 그에 대 응하는 L 1 캐 쉬 안에 있는 임의의 행 에 대 하여 L 1 행의 상태 
는 L 2 행의 상태를 따른다. 이를 위한 간단한 방법은 L 1 에 동시쓰기방식을 적 용하는것 이 
다. 이 경 우에 동시 쓰기 는 기 억 기 가 아니 라 L 2 캐 쉬 에 한다. L 1 의 동시 쓰기방식 은 L 2 캐 
쉬 가 아니 라 L 1 행 을 변경 시 키므로 이것 을 다른 L 2 에서 볼수 있다. L 1 에 동시 쓰기방식 
을 리용할 때 L 1 내용은 L 2 내용의 일부분이여 야 한다. 따라서 이것은 L 2 캐쉬의 련상성 
이 L 1 의 련상성 ( Associativity ) 과 같거 나 더 커 야 한다는것 을 말해 준다. L 1 동시 쓰기 방 
식은 IBM S /390 콤퓨터에서 리용되였다. 

만일 L 1 캐 쉬 가 비 동시 쓰기방식 을 리 용한다면 두 캐 쉬 사이 의 관계 는 더 복잡해 진 다. 
일치성을 유지하기 위한 여러가지 방안들이 제기되고 있는데 Pentium II 에서 리용된 방 
식 은 참고문헌 [ SHAN 98] 에 구체 적 으로 서 술되 여 있 다. 


제 4절. 클라스터 

최 근 를퓨터 체 계 설계 에서 가장 본격 화되 고 있는것은 클라스터 화이 다. 클라스터 화 
(콤퓨터 병 렬 화)는 고성 능과 높은 리 용률을 얻 기 위 하여 대 칭 다중처 리 방식으로 나가고 있 
으며 봉사기적용에 특별히 적중하다. 클라스터는 단일한 계산자원을 함께 처 리 하는 호상 
련결된 전체 콤퓨 터들의 하나의 그롭이라고 정의할수 있다. 전체 콤퓨터라는 말은 개별 
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적콤퓨터들이 클라스터와 독립적으로 실행할수 있는 하나의 체계를 의미한다. 문헌에서 
는 이 병렬콤퓨터의 매개 콤퓨터들을 마디라고 부르고 있다. 

문헌 [ BEEW 9 기 에서는 콤퓨터의 병 렬화로 엄 어 지는 우점을 4 가지 로 분류하였다. 
이것들은 설계요구 혹은 설계목표로 볼수 있다. 

• 절대스칼라성 : 제 일 큰 자체봉사기능을 갖춘 기 계의 능력 을 훨씬 초과하는 대규 
모클라스터를 실현할수 있다. 

• 확장스칼라성: 병렬콤퓨터는 새로운 체계를 조금씩 보충할수 있게 구성된다. 따 
라서 사용자는 자기에게 알맞는 체계로부터 시작하여 현재의 작은 체계를 보다 
큰 체계로 교체함이 없이 필요에 따라 그것을 확장한다. 

• 높은 리용률: 병렬콤퓨터의 매개 마디는 독립콤퓨터로 되여 있으며 따라서 하 
나의 마디에서 오유가 생긴다고 하여 봉사에서 손실을 본다고 말할수 없다. 많 
은 제 품들에 서 고장은 쏘프트웨어 에 의하여 자동적 으로 조종된 다. 

• 높은 가격 대 성능 비 : 상품화된 개 별적콤퓨터들을 결합하여 구성하므로 하나의 
큰 기계와 같거나 그보다 더 높은 처리성능을 가지면서 훨씬 눅은 병렬콤퓨터 
를 만들수 있다. 

1. 병렬콤퓨터의 조직 

문헌들에서 병렬콤퓨터는 여 러가지 방법으로 분류하고 있다. 제 일 간단한 분류는 병 
렬콤퓨터안의 콤퓨터 들이 갈은 디 스크에 대 한 접근을 공유하는가 안하는가에 기초한다. 
그림 16-9 자 에 클라스터 의 동작을 조종하기 위한 통지 문교환에 리용되 는 고속련결 로에 
의 하여 서 만 호상 결 합된 두마디병 렬콤퓨터 를 보여 주었 다. 련결기 구는 다른 비 콜라스터 
콤퓨터와 공유되는 국부망일수도 있으며 전용호상련결기구일수도 있 다. 후자의 경우에 
클라스터안의 하나 혹은 여 러개의 콤퓨터는 봉사기클라스터 와 원격의뢰기체계사이의 련 
결 을 보장하도록 국부망이 나，광대역 망에 접 속되 여 야 한다. 주의할것 은 그림 에 서 매 개 콤 
퓨터들은 다중처리장치체계로 되여 있는것처럼 그려져 있다는것이다. 이것은 필요 없을 
뿐아니 라 성능과 리용가치도 높지 못하다. 

그림 16-9 에서 보여 준 간단한 분류에서 다른 하나의 방식은 디스크공유클라스터 이 
다. 이 경우에 일반적으로 마디들사이의 통지문통로는 여전히 존재한다. 게 다가 여기에는 
콜라스터안의 다중를퓨터들에 직접 련결되는 디스크보조체 계 가 있다. 이 그림 에서 공동 
디스크보조체계는 RAID 체계 이다. RAID 나 그와 류사한 일부 여유디스크기술은 다중를 
퓨터 에 의하여 실현되 는 높은 리 용가치 가 하나의 오유가 있는 공유디 스크에 의하여 떨 어 
지 지 않도륵 하기 위하여 리 용되 고 있 다. 

클라스터선택의 범위 에 대 한 보다 명백한 구상은 기능선택 에 의하여 엄 어 진다. 훌 
래 트-팩 카드 [ HP 96] 의 백 서 에 는 기 능에 따르는 분류가 소개 되 여 있 다(표 16-2). 

일 반적 이 면서 도 낡은 방법 인 피 동대 기 (passive standby ) 방법 은 단순히 다른 콤퓨터 
가 비능동상태 인 경우에 한 콤퓨터 가 모든 처 리부하를 담당하는것으로서 이 처 리부하는 
1 차측의 고장으로 하여 대기하고 있다. 능동이면서 1 차인 를퓨터를 조종하기 위하여 체 
계는 대기하는 기계에 《동작중》의 통보문을 계속 보낸다. 이 통보문이 수신되지 않으면 
대기중의 기계는 1 차봉사기가 고장났다는것을 예측하고 자기가 동작상태로 들어 간다. 
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방안은 리용가치는 있지만 성능을 개선할수 없다. 더우기 두 체계사이에 교횡 
1- 《동작중》상태라는것밖에 없고 두 체계가 공동디스크를 공유하지 않는다면 
수는 측은 기능지원을 하지만 1 차측에 의 하여 관리되는 자료에 접근하지 못한 

피동대기방법은 일반적으로 클라스터에서 쓰이지 않는다. 콜라스터라는 밀 
i 된 콤퓨터를 념두에 둔것으로서 모든 처리장치들이 능동적으로 처리하지만 i 
마치도 하나의 콤퓨터와 같이 보인다. 이 구성 에서 는 흔히 능동2차방법을 쓴 
r 세 가지 즉 개 별봉사기 들，비공유 및 공유기억 기 로 분류할수 있다. 

병렬화의 첫번째는 개별봉사기방식인데 이것은 매개 콤퓨터가 분리된 봉사기 
수기들은 자기자체의 디스크는 가지고 있지만 체계들사이에 공유하는 디스크 
림 16-9 1). 이러한 배렬은 높은 성능과 리용가치를 가진다. 이 경우 부하의 
노고 높은 리 용률을 보장하기 위하여 입 력 되는 의 뢰 기의 요구들을 봉사기 에 1 
몇 가지 관리형 태 와 쏘프트웨어의 순서짜기 가 요구된다. 이것은 고장극복능력 
h 하자는것으로서 콤퓨터가 응용프로그람을 실행하는 도중에 고장이 생기면 ᅬ 
1 다른 콤퓨터가 그것을 장악하여 응용프로그람의 실행을 완료한다. 이를 위 
느 늘 체 계 안에 복사되 여 있 어 야 하며 이 렇 게 하여 야 매 개 체 계 가 다른 체 계 의 


h 접근할수 있다. 이 자료교환을 위 한 보조조작은 성능에서 손실은 보지만 높 







표 16-2. 집 합방법 : 우점 과 제 한성 


집 합방법 

설명 

우점 

제한성 

피동대기 

1 차봉사기가 고장인 경우 

2차봉사기가 기동한다 

실현하기 쉽다 

2차봉사기 를 다른과제처 
리에 리용할수 없으므로 
비용이 높다. 

2 차능동; 

2 차봉사기 호 과제 처 리 에 
리 용한다. 

2 차봉사기 를 과제 처 리 
에 리용할수 있으므로 
비용이 낮다. 

복잡성이 증가한다. 

봉사기분리 

분리된 봉사기들이 자기 
의 디스크를 가전다. 자 
료가 1 차에 서 2 차봉사기 
로 련속적으로 복사된다. 

높은 리용성을 가전다. 

조작복사로 인한 망 및 봉 

사기간접소비시간이 길어 

진 다. 

봉사기를 디스 

크에 련결 

봉사기를 같은 디스크에 
련결하지만 매개 봉사기 
는 자기의 디스크를 가전 
다. 어떤 봉사기가 고장 
나면 다른 봉사기가 그의 
디스크들과 련결된다. 

조작복사가 없으므로 

망 및 봉사기 간접소비 

시간이 단축된다. 

디스크고장 위험을 보상하 
기 위하여 보통 디스크미 
러 링 ( mirroring ) 혹은 RAID 
기술을 요구한다. 

봉사기들이 

디스크를 공유 

여 러개의 봉사기들이 디 
스크에 대한 접근을 동시 
에 진행한다. 

망 및 봉사기 간접소비 
시간이 짧다. 디스크고 
장으로 인한 수리시간 
이 감소된다. 

관건관리기쏘프트웨어를 
요구한다. 보통 디스크미 
러 링 혹은 RAID 기 술을 
함께 리용한다. 


통신에 서 이 보조조작을 줄이 기 위하여 대 부분의 클라스터 는 현재공동디 스크에 련 
결된 봉사기들로 구성한다(그림 16-9 u ) . 이 방식가운데서 하나의 변종을 간단히 공유 
없는 방식이라고 한다. 이 방식에서 공동디스크는 용량별로 나누어 져 있으며 매개 용량 
은 개 별적 콤퓨터 에 의하여 관리 된다. 만일 그 콤퓨터 가 고장이 면 클라스터 는 다른 콤퓨 
터들이 고장난 콤퓨터의 용량에 대한 소유권을 가지도록 재구성되여야 한다. 

또한 다중콤퓨터들은 갈은 시 간에 갈은 디스크를 공유할수 있어 야 하는데 (이 것을 공유 
디스크방식이라고 한다.) 그렇게 하여야 매개 콤퓨터가 모든 디스크에 있는 용량들을 접근할 
수 있다. 이 방법은 자료가 한번에 하나의 콤퓨터에 의해서만 접근될수 있다는것을 확인하기 
위하여 몇가지 류형의 관건기구를 리용하는것이 필요하다. 

2. 조작체계설계항목 

클라스터의 하드웨 어구성을 충분히 리 용하기 위 하여서는 단일처 리 장치체계의 조작 
체계에 다음과 갈은 몇가지 기능을 더 첨부한다. 

고장관리 

집 합화하는 방법 에 따르는 클라스터 에 의 하여 고장은 어떻게 관리되는가(표 16-2). 
일 반적 으로 고장을 처 리 하기 위 하여 두가지 방법 즉 클라스터방식 과 고장허 용(내 고장성 ) 
클라스터방식이 있다. 콜라스터는 모든 자원들이 복사중에 있어야 할 확률이 높다. 만일 
체계 가 정지되거 나 디스크용량을 잃어 버리는것과 같은 고장이 일어 나면 차례로 질문을 
잃어 버린다. 다시말하여 클라스터안의 서로 다른 콤퓨터들이 임의의 잃어 버 린 질문들 
을 봉사한다. 그러나 클라스터의 조작체계들은 부분적으로 실행된 처리요구의 상태에 대 
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하여 보증하지 않는다. 이것은 응용프로그람준위 에서 조종되 는것 이 필요하다. 

고장허용클라스터는 모든 자원을 쓸수 있게 확보한다. 이것은 여유공유디스크를 리 
용하든가 해 당되지 않는 처 리요구를 취소하는 기구를 쓰든가 완성된 처 리요구를 위 탁하 
든가 하는 방법 으로 해 결한다. 

고장난 체계로부터 그 클라스터안의 선택된 체계에로 응용프로그람과 자료자원을 
절환하는 기능을 고장극복이 라고 한다. 그와 관계되는 기능을 일단 그것 이 고착되면 본 
래체계에로 응용프로그람의 자료를 복귀한다. 이것을 고장복귀라고 한다. 고장복귀는 자 
동적으로 할수 있지만 이것은 그 문제가 정확히 고착되였거나 복귀하는것이 명백한 경우 
에만 가능하다. 만일 그렇지 않으면 자동적 인 고장복귀는 고장난 자원들이 콤퓨터들사이 
에서 오락가락하게 만들어 도리여 성능과 복귀에 문제를 야기시 킨다. 

부하균형 

클라스터는 가능한 콤퓨터들안에서 부하균형을 맞추기 위한 능력을 가져야 한다. 여 
기에는 클라스터를 점차적으로 스칼라화하려는 요구가 담겨져 있다. 새로운 콤퓨터가 클 
라스터로 확장될 때 부하균형기구는 응용프로그람의 순서를 짜면서 이 콤퓨터 에 자동적 
으로 포함된다. 미 들웨 어 ( middleware ) 기 구는 클라스터 의 서 로 다른 개 별를퓨터 에 봉사 
가 나타 날수 있으며 한 개별콤퓨터로부터 다른 개별콤퓨터에로 옮겨 갈수 있다는것을 
인식해야 한다. 

3. 클라스터와 대칭다중처리장치 콤퓨터 

클라스터들과 대칭 다중처 리장치콤퓨터들은 둘 다 높은 요구를 제기하는 응용프로그 
탐을 지원하는 다중처 리장치들로 구성되여 있다. 이 두 방식은 상업적으로 가능하다. 

대 칭 다중처 리 장치방식 의 기 본우점 은 클라스터방식 보다 관리 와 구성 이 쉽 다는것 
이다. 이 방식에서는 거의 모든 응용프로그람작성모형이 단일처리장치방식과 밀접한 
관계 가 있다. 단일처 리 장치 로부터 대 칭 다중처 리 장치 로 전환되 는데 서 요구되 는 기 본요 
인은 순서 짜기 기 능이 다. 대 칭 다중처 리 장치콤퓨터의 다른 우점 은 일 반적 으로 클라스터 보 
다 물리적공간이 작고 전력소비가 적은것이다. 대칭다중처리장치의 가장 중요한 또 하나 
의 우점은 설치가 쉽고 안정한것이다. 

그런데 집 합콤퓨터방식 의 우점 은 고성 능봉사기시 장을 이 콤퓨터 들이 지 배하는것 이 
다. 클라스터 들은 증분과 절 대 스칼라성 의 견지 에 서 보면 대 칭 다중처 리 장치 방식 보다 훨 씬 
더 앞서 있다. 클라스터들은 체계의 모든 요소들이 높은 여유성을 보장할수 있기때문에 
리용성의 견지에서도 우월하다. 

제 5절. 비균일기억기접근 

상품의 견지 에서 응용프로그람을 지원하기 위하여 다중처 리장치체계를 갖춘 두가지 
대표적 인 방식은 대칭 다중처 리장치 방식과 클라스터 방식 이 다. 몇 해동안 비균일기 억기접근 
이라고 불리우는 새로운 방법이 연구대상으로 되고 있으며 최근에는 이것을 리용한 제품 
들이 나타나고 있다. 
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선행에 앞서서 비균일기억기접근에 관한 문헌들에서 나오는 몇가지 용어를 정의하 
기로 하자. 

• 비균일기 억기접근 ( UMA ): 모든 처 리장치들은 읽기와 쓰기를 리용하여 주기억기 
의 모든 부분을 접근할수 있다. 기억기의 모든 부분에 대한 접근시간은 꼭 갈다. 
제 2절과 제 3절에서 론의 한 대 칭 다중처 리 장치체계 가 이 방식 에 속한다. 

• 비균일기억기접근 ( NUMA ): 모든 처리장치들은 읽기와 쓰기를 리용하여 주 
기 억기의 모든 부분을 접 근할수 있다. 처 리 장치의 기 억 기 에 대 한 접 근시 간은 
주기억 령역의 어 느곳을 접근하는가에 따라 다르다. 서 로 다른 처 리 장치 에 있 
어서 어떤 기억령역에서는 접근이 더 빨라 지고 어떤 기억령역에 대해서는 
접근이 더 떠진다. 

• 캐쉬일 치성 비균일기 억기접근 ( CC - NUMA ): 캐쉬의 일 치성 이 여 러 가지 처 리 장치 
의 캐쉬안에서 유지되는 비균일기 억기접근체계를 말한다. 

캐쉬일치성이 없는 비균일기억기접근체계는 어느 정도 클라스터체계와 등가이다. 최 
근에 주목을 끄는 상품들은 캐 쉬 일 치 성 이 있 는 비 균일 기 억 기 접 근체 계 들이 며 대 칭 다중처 
리장치체계와는 완전히 구별된다. 이러한 체계는 문헌에서 캐쉬일치성기능을 가진 비균 
일기억기접근체계라고 한다. 이 절에서는 이 체계 에 대 해서만 론의한다. 

1. 비균일기억기접근들 리용하게 된 동기 

대칭다중처리장치체계에는 리용할수 있는 처리장치의 수에 실천적인 제한성이 있다. 
캐쉬의 리용에서 효과성 이 높아 지는데 따라 어느 한 처 리장치와 주기억기상의 모선전송 
능력은 감소한다. 처 리장치의 수가 증가함에 따라 이 모선전송능력은 증가한다. 모선은 
또한 캐쉬의 일치성신호들을 교환하는데도 리용되므로 모선부하는 더 커진다. 일부 측면 
에서 모선은 성능을 높이는데 난점으로 된다. 성능의 감소는 대칭 다중처 리장치조직에서 
16개로부터 64개 범위로 처리장치의 수를 제한한다. 례하면 실리콘그라픽스파워첼린져회 
사의 대칭다중처리장치콤퓨터는 하나의 체계에 R 10000 처리장치가 64개로 제한되여 있다. 
이 수를 넘으면 성능은 실제로 감소한다. 

대 칭 다중처 리 장치체 계 에서 처 리 장치수의 제 한은 집 합처 리 장치체계의 개 발을 추동한 
요인의 하나이 다. 그런데 집 합처 리 장치 체 계 에서 매 개 마디 는 자기 자체 를 위한 국부주기 
억기들을 따로 가지고 있으므로 응용프로그람들은 큰 공동기억기를 요구하지 않는다. 실 
제 로 일치성은 장치 에 의 해서 가 아니 라 쏘프트웨어 에 의하여 유지된다. 이 기 억 기 접근은 
성 능에 영 향을 주며 최 대의 성 능을 얻기 위하여 쏘프트웨어 가 이 환경 에 맞아야 한다. 
대 칭 다중처 리 장치 체 계 의 우점 을 유지 하면서 대 규모다중처 리 를 실 현 하기 위 한 한가지 방 
법 은 비균일기 억기접근을 실현하는것 이 다. 례하면 실 리콘그라픽 스오리 진회사의 비균일기 
억 기 접 근체 계 는 MIPS R 10000 처 리 장치 를 1024 개 까지，시 켄 드 NUMA-Q 체 계 는 Pentium 
D 처 리 장치 를 252개 까지 지 원할수 있게 설계 되 였다 [ LOVE 96]. 

비 균일 기 억 기 접 근의 목적 은 매 개 마디 가 개 별 적 인 모선 혹은 다른 내 부호상결 합체 
계를 가지는 여러개의 다중처리장치마디들을 허가하는 한편 현존하는 체계의 넓은 대역 
기 억기를 가지도록 하는것 이 다. 

2. 내부조직 

그림 16-10 에서는 전형적 인 CC-NUMA 의 내부조직을 보여 주었다. 여기 에는 여 러 
개 의 독립 적 인 마디 들이 있는데 이 매 개 마디 가 실제 로 대 칭 다중처 리소방식 으로 되 여 
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하는가를 보기 위하여 실례 를 [ PEIS 98] 에 주었 다. 마디 3의 처 리 장치 2( P 2-3) 은 기 억 주 
소 798 을 요구하는데 이 주소가 마디안의 기 억 주소를 의 미 한다면 다음과 같이 동작과정 
에 있게 된다. 

• P 2-3 은 주소 798 을 접근하기 위 하여 마디 2 의 엿보기모선에 읽기요구를 출력 한다. 

• 마디 2 에 대한 목록은 그 요구를 통하여 주소가 마디 1 안에 있다는것을 인식한다. 

• 마디 2의 목록은 마디 1에 요구를 내 보내 고 그리 고 마디 1의 목록에 의하여 선 
택된 다. 

• P 2-3 을 대 신하는 마디 1은 마치 도 그것 이 처 리 장치인것 처 럼 798주소의 내 용을 
요구한다. 

• 마디 1의 주기억 은 모선우에 요구하는 자료를 태 웠 음을 응답한다. 

• 마디 1의 목록은 모선으로부터 자료를 선택한다. 

• 그값은 마디 2의 목록에 로 도로 전송된다. 

• 마디 2 의 부록은 그것을 처음에 취했던 기 억기를 대 신하는 마디 2 의 모선에 자 
료를 다시 놓는다. 

• 값은 선택 되 여 P 2-3 의 캐 쉬 에 기 억 되 여 다시 P 2-3 을 읽 는다. 

다음으로 처 리 요구가 처 리 장치 에 쏘프트웨어 기구를 리용하여 원격기 억기 로부터 자 
료를 어떻게 읽는가 하는것을 보기 로 하자. 이 기구에 몇 가지 형 태의 캐쉬일치성규약이 
필요하다. 여러가지 체계에서는 이것을 어떻게 하는가 하는데 차이가 있다. 여기서 일반 
적인 몇가지 문제에 대해서만 보기로 하자. 먼저 선행과정의 한 부분으로서 마디 1의 목 
륵은 일부 원격캐쉬 가 주소 798 안에 있는 항을 복사한 기록을 가지 고 있다. 그때 변경 을 
위하여 협동규약이 필요하다. 례하면 변경이 캐쉬안에서 집행되면 이 사실은 다른 마디 
들에 통보된다. 그러한 통보를 받는 매 개 마디의 목록은 임의의 국부가 그 행을 가지고 
있겠는가 그것 을 삭제하였는가를 결정할수 있다. 만일 실제 의 기 억주소가 통보를 받는 
마디에 있다면 그때 그 마디의 목록은 되쓰기가 생길 때까지 기억기의 그 행을 유효상태 
에 서 그대 로 유지 하도록하는것 을 지 적하는 시 작주소를 기 억 하고 있는것 이 필 요하다. 다 
른 처 리 장치 (국부 혹은 원격 ) 가 무효인 항을 요구하면 그때 국부등록부는 자료를 출력하 
기 전에 비 동시 쓰기 에 의하여 기 억 기 가 갱 신되 게 하여 야 한다. 

3. 비균일기억기접근의 우결함 

CC-NUMA 의 주요한 우점 은 특별 한 쏘프트웨어 의 변화를 요구함이 없 이 대 칭 다중 
처 리장치체계보다는 높은 수준의 병렬화성능을 실현할수 있는것 이 다. 다중 NUMA 마디 
들로 임의의 개별적인 마디에 대한 모선통과량은 모선이 조종할수 있는 요구에 제한을 
준다. 그런데 만일 대부분의 기억기접근이 원격마디에 대하여 진행된다면 성능은 떨어 
지 기 시 작한다. 이 체 계성능저 하를 피 하기 위한 몇 가지 방안이 제기되 여 있다. 첫째 로， 
원격 인 기 억기를 비 롯하여 모든 기 억 기접 근을 최소화하기 위 하여 L 1 과 L 2 캐 쉬 리 용문제 
가 제기되였다. 만일 대부분의 하드웨어가 좋은 시간국부성을 가지고 있다면 그때 원격 
기 억접근은 크게 문제 로 되지 않는다. 둘째 로，쏘프트웨어 가 좋은 공간국부성 을 가지고 
있고 가상기 억기가 리용되 고 있다면 응용프로그람을 위하여 요구되는 자료는 자주 리용 
되 는 제 한된 수의 폐 지 안에 기 억 되 여 있게 되 는데 이 페 지 들은 집 행하는 응용프로그람에 
들어 가는 극소기 억기에 넣을수 있다. 시켄트 설계 자들은 그러한 공간국부성 이 대표적 인 
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응용프로그람들에 서 나타난다는 보고를 제 기 하였다 [ Love 96]. 마지 막으로 가상기 억기능 
은 가상기 억폐지 를 그것 을 자주 리용하는 마디 에 로 옮기 는 폐 지 이동기 구를 포함시키는 
방법으로 강화할수 있다. 실리콘그라픽스설계자들은 이 방법이 가지고 있는 우점을 발표 
하였다 [ WHIT 97]. 

CC-NUMA 에는 또한 결함도 있다. [ PFIS 98] 에서는 이에 대한 두가지 문제를 특별 
히 구체적으로 론의하였다. 첫째 로 CC-NUMA 는 명백히 대 칭 다중처 리장치와 같이 볼수 
없으며 대칭 다중처 리 장치로부터 CC-NUMA 체계 에 로 조작체 계와 응용프로그람을 이식하 
기 위 하여서는 쏘프트웨어의 변화가 요구된다. 이 변화에는 페지배 치와 앞에서 언급된 
프로쎄 스배 치，조작체 계 에 의한 부하균형 맞추기 등이 포함된다. 둘째 로 리 용성 문제 이 다. 
이것은 복잡한 항목으로서 CC-NUMA 체계의 정확한 실현과 관련된다. 구체적인것은 
[ PEIS 98] 에 밝혀 져 있다. 


제 6절. 백토르계산 

일반용대형콤퓨터의 성능이 계속 높아 진다고 할지 라도 현재 콤퓨터로 실현할수 없 
는 응용문제들이 수없이 제기된다. 즉 류체력학，지질학，기상학，원자핵과 플라즈마물리 
학을 비롯한 학문분야에서 제기되는 수학적문제를 풀기 위하여 를퓨터가 필요하다 
[ WILS 84]. 

특히 이 문제들은 높은 정확도를 요구하며 수들의 큰 배럴에 대하여 (큰 행렬식에 
대하여) 류점수연산을 여 러번 반복하여야 하는 특징 이 있다. 이 문제의 대부분은 련속마 
당모의 라고 하는 범주에 귀 착된다. 례컨데 물리적조건은 3 차원안의 면이든가 령역에 의 
하여 표현될수 있다(례하면 로케트의 표면에 접촉한 공기의 흐름.) 이 면은 격자점을 리 
용하여 근사화할수 있다. 여러개의 미분방정식은 매개 점에서의 면의 물리적거동을 정의 
한다. 방정 식 들은 값과 결 수들의 배 렬 (행 렬 전개 ) 에 의하여 표현되 며 풀이 과정 은 자료배 
렬에 대하여 산수연산을 반복하게 된 다. 

이러한 류형의 문제를 풀기 위하여 슈퍼콤퓨터가 개발되였다. 이 기계는 Is 에 수억 
회의 류점수연산을 수행한다. 다중프로그람과 I 八)기능을 수행하기 위하여 설계된 대형를 
퓨터와는 달리 슈퍼콤퓨터는 앞에서 서술한 수학적계산을 최적화한다. 

슈퍼콤퓨터는 가격문제와 시장문제로 하여 리용에서 제한성 이 있다. 이 기계들은 연 
산에 리용되는것은 적고 대부분은 과학쎈터들과 과학 및 공학연구기능을 가진 정부기관 
들에서 쓰인다. 콤퓨터기술의 다른 령역과 마찬가지로 슈퍼콤퓨터의 성능을 높이는데서 
일정한 요구가 제기된다. 류체력학과 핵물리분야의 일부 응용에서 현대 콤퓨터가 이틀이 
상이 걸려야 하는 10 13 회의 산수연산이 하나의 문제 로 된다 [ LEVI 8 幻 . 그러므로 슈퍼를퓨 
터의 기술과 성능을 계속 발전시키고 있다. 

벡 토르연산을 위한 요구를 실현하기 위하여 설계 된 새 로운 다른 체 계 즉 배 렬처 리 
장치체계 가 있다. 비록 슈퍼콤퓨터 가 벡 토르계산을 최적화하지 만 그것은 스칼라처 리과제 
와 일반자료처 리과제를 조종할수 있는 일반용콤퓨터 에 불과하다. 배 렬처 리 장치는 스칼라 
처 리를 하지 않으며 그것들을 프로그람의 벡 토르화된 부분만을 실행 하기 위하여 대형콤 
퓨터 와 소형콤퓨터의 사용자들의 견지 에서 는 주변장치처 럼 동작하도록 구성한다. 
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1. 백토르계산방법 


슈퍼콤퓨터나 배렬처리장치체계를 설계하는 열쇠는 그 기본과제가 류점수의 배렬 혹 
은 벡 토르산수연산을 수행 한다는것 을 인식 하는것 이 다. 이 것 은 일 반용콤퓨터 에 서 배 럴 의 매 
개 요소에 대하여 반복연산을 요구한다. 례하면 두수의 벡토르 (1 차원배렬) A 와 묘 에 대하 
여 보기로 하자. 방법은 두 원소의 더하기를 하는것으로 된다(그림 16-11). 이 계산을 고 
속화하기 위하여서는 어떻게 해야 하는가? 그 대답은 명백히 연산의 병렬화이다. 
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그림 16-11. 벡토르더하기 


벡 토르계 산의 병 렬 화를 실 현 하기 위하여 여 러 가지 방법 을 취 하고 있 다. 

이것을 실례를 통하여 보여 주었다. 벡토르적 (곱하기) C = AXB 를 보기로 하자. 여 
기서 A ， B 그리고 C 는 N X N 행렬이다. C 의 매개 원소에 대한 공식은 다음과 같다. 

N 

Cij - JLai,k x bkj 

여기서 A , B , C 는 각각 원소 이，” b Uj 그리고 c hj 로 되 여 있다. 그림 16-12 T 는 
이 계산을 위하여 작성한 포트란프로그람을 보여 주었는데 이 프로그람은 보통 스칼라처 
리 장치 에서 실행할수 있다. 


DO 100 I = 1 ，N 
DO 100 J = 1 ，N 
C ( I ， J )=0.0 
DO 100 K =1 ,N 
DO 100 K =1 ,N 
C ( I , J )= C ( I , J ) + 
A ( I , K )* B ( K ， J ) 
100 CONTINUE 

I) 


DO 100 I =1 ,N 
C ( I , J )= C ( I , J ) + 
A ( I , K )* B ( K , J ) ( J =1, N ) 
100 CONTINUE 


니 


그림 16-12. 행렬곱하기 


DO 50 J =1 ,N 
FORK 100 
50 CONTINUE 


100 DO I =1 ,N 
C ( I , J ) =0,0 
DO 200 K =1 ,N 
C ( I , J ) = C ( I , J)H 
A ，( I , K )* B ( K , J ) 
200 CONTINUE 
n) 


c - 병렬처리과정 


T - 스칼라처리과정， i •-벡토르처리과정， 


성능을 개선하기 위한 한가지 방법 을 벡 토르처 리 라고 한다. 이것은 1차원벡 토르자료 
에 대 한 조작이 가능하다는것을 예측할수 있다. 그림 16-12 1•는 벡토르계산을 규정하는 
새로운 명 령형식으로 된 포트란프로그람이다. 기호 ( J =1， N ) 는 주어 진 간격안의 모든 첨 
수 J 에 대한 연산이 한번의 조작에 의하여 수행된다는것을 의미한다. 이것이 어떻게 실 
현될수 있는가를 간단히 보기로 하자. 

그림 16-12 i ■의 프로그람은 i 번째 렬의 모든 원소들을 병렬로 계산하는것을 보여 
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주었다. 렬안의 매개 원소는 합계산되며 합계산들은 병렬이라기보다 직렬적으로 진행된 
다. 스칼라알고리 듬에 따르는 N 3 스칼라곱하기연산들과 비 교해 볼 때 이 N 2 벡 토르곱하 
기연산만이 이 알고리듬에 따라 수행된다. 

다른 방식인 병렬 처리과정을 그림 16-12 도에 보여 주었다. 이것은 병렬로 동작할수 
있는 N 개의 독립적인 처리장치로 되여 있는것을 전제로 한다. 처리장치를 효과적으로 
리용하기 위하여 여 러 처 리 장치 들에 어 떻게 해서든지 계산을 나누어 시켜 야 한다. 여 기 
서 두개의 내정값이 처 리를 시 작하게 한다. 한편 원시프로쎄스는 FORK 다음의 명 령 에서 
실행을 계속한다. FORK 의 모든 실행은 새로운 프로쎄스를 낳는다. FORK N 명령문은 
N 개의 독립적인 프로쎄스들이 JOIN 다음의 명령에서 실행을 계속하는 프로쎄스에 련결 
되게 한다. 조작체계는 이 련결을 조종하며 그로 하여 N 개의 모든 프로쎄스들이 JOIN 
명 령 에 도달하였을 때 까지 는 실행을 계 속하지 않는다. 

그림 16-12 도 의 프로그람은 벡 토르처 리프로그람의 거 동을 모방하여 작성한것 이 다. 
병 렬 처 리 프로그람에 서 C 의 매 개 행 은 개 별 적 인 프로쎄 스에 의 하여 계 산된 다. 따라서 주 
어 진 C 의 렬안의 원소는 병 렬로 처 리된다. 


입구등록기 관흐름화된 산수론리연산장치 



그림 16-13. 백토르계산에 대한 방식 
기 - 관흐름화된 산수론리 연산장치， l - 병 렬 산수론리 연산장치 

다음으로 론리 적 및 방식적 인 견지 에 서 벡 토르계 산방법 을 고찰한다. 이 제 이 방 
법을 실현하는데 리용할수 있는 처리장치의 류형들을 보기로 하자. 여러가지 류형의 
기 본방식 이 리용되 였 거 나 리용되 고 있다. 그가운데 서 다음의 세 가지 류형 이 두드러 지 
게 리용되 고 있다. 

• 관흐름 ALU 

• 병렬 ALU 
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그림 16-14. 관흐름처리 

-I -관흐름화된 산수-론리 연산장치 ， "L- 4 개 의 병 렬산수-론리 연산장치 
이 구성은 벡토르처리에 적합하다는것이 명백하다. 이것을 알기 위하여 제 11 장에서 서 
술한 명령관흐름에 대하여 고찰해 보자. 처리장치는 꺼내기명령과 처리명령의 주기를 반복한 
다. 분기가 없으면 처리장치는 계속하여 다음주소에서 명령꺼내기를 한다. 결과적으로 관흐 
틈이 계 속 차 있게 되 며 시 간이 절 약된 다. 류사한 방법 으로 관흐름산수-론리연산장치 는 순차 
주소로부터 자료의 흐름을 입력시키면 시간을 절약한다. 하나의 분리된 류점수연산에서는 관 
흐름에 의하여 속도가 높아 지지 않는다. 속도제고는 연산수벡토르가 ALU 에 들어 올 때만 실 
현된다. 조종장치는 전체 벡토르가 다 처리될 때까지 ALU 를 통하여 자료처리를 반복한다. 


• 병렬처리장치 

그림 16-13 에 세 가지 류형가운데서 앞의 두가지를 보여 주었다. 관흐름에 대 해서는 
제 11 장에서 이미 론의하였다. 여기서는 두 개념을 ALU 의 조작애까지 확장하였다. 류점 
수연산은 비교적 복잡하기때문에 류점수연산을 여 러개 단으로 분해하되 매 단에 서로 다른 
자료묶음을 병행적으로 조작할수 있도록 한다. 

이것을 그림 16-14 자에 주었다. 류점수더하기는 4개 즉 비교, 밀기，더하기와 정규 
화로 나누어 져 있다(그림 8-22). 수의 벡토르들은 차례 로 첫 번째 단에 입구된다. 처리순 
서에 따라 4개의 서로 다른 수의 묶음은 관흐름안에서 병행적으로 조작되게 된다. 
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벡 토르요소가 주기 억 기 로부터 가 아니 라 등록기 들에 서 유용하다면 관흐름조작은 더 
강화된다. 이것은 실제로 그림 16-13 자에서 이미 제기하였다. 매개 벡토르연산수의 원소 
들은 벡토르등록기의 블로크에 넣 어 진다. 벡토르등록기는 동일한 등록기들의 묶음에 불 
과한다. 그 결과는 다시 벡토르등록기에 넣어 진다. 따라서 대부분의 연산은 등록기들을 
리용하여 다시넣기，쓰기조작만을 할수 있으며 벡토르연산의 시 작과 끝에서만 기 억기접 
근을 요구한다. 

그림 16-14 에 보여 준 기 구를 연산속의 관흐름처 리 방식 이 라고 한다. 즉 벡 토르연산 
수들에 적 용되 는 하나의 산수연산 (례하면 C = A + B ) 을 가지 며 그다음 관흐름처 리 는 여 러 
개의 벡토르원소(요소)들이 병렬로 처리되게 한다. 이 기구를 연산의 관흐름처리방식이 
라고 한다. 후자의 경우에 산수벡토르연산과정이 있으며 명령관흐름은 처리속도를 높이 
는데 리용된다. 련쇄화에 대 한 기본규칙은 다음과 갈다. 백 토르연산은 연산수벡토르의 첫 
원소가 유용하며 기능장치 (례하면 더 하기，덜기，곱하기，나누기)들이 동작가능한 상태 
(자유로운 상태)에 있으면 즉시에 벡토르연산을 시작한다. 

실례로 련쇄는 어느 한 기능장치로부터 출력되는 결과를 곧바로 다음기능장치에 입 
력시키며 그것이 또 다른 기능장치에 입력되는 식으로 련결한다. 벡토르등록기들을 리용 
하면 중간결과는 기억기에 기억되지 않으며 그것을 만들어 낸 벡토르연산이 끝날 때까지 
리용할수 없다. 

례 하면 C =( SXA)+B 를 계 산할 때 (여 기서 A ， B , C 는 벡 토르이 고 s 는 스칼라이 다. ) 
크레 이 ( Cray ) 슈퍼콤퓨터는 한번에 세개의 명령을 수행한다. 넣기를 하여 꺼낸 원소(요 
소)들은 즉시에 관흐름곱하기장치에 들어 가며 그 적은 관흐름더하기장치에 보낸다. 그 
리 고 더 한 결 과는 더 하기 장치 나 더 하기 연산을 끝내 자마자 벡 토르등록기 에 넣 어 진다. 


• 벡 토르넣 기 A ᅳ벡 토르등록기 ( VR 1) 


BC VR2 


• 벡 토르곱하기 sXVRl—VR3 

• 벡 토르더 하기 VR3+ VR2 수 YR4 

• 벡 토르쓰기 VR4 — C 


두번째와 세번째명령은 련쇄화될수 있는데 왜냐하면 그것들은 서로 다른 기억주소 
와 등록기 들을 가지 고 있기 때문이 다. 4 번째 명령은 두번째 와 세 번째 명령의 결과를 요구 
하지만 이것은 또한 그것들과 련쇄될수 있다. 벡토르등록기 2와 3의 첫 원소들이 유용하 
게 되면 즉시에 4번째 명 령에 대한 조작이 시작된다. 

여 러개의 산수-론리연산장치를 넣 어 하나의 조종장치 에 의하여 조종하게 하는것 
이 다.이 경우에 조종장치는 산수-론리연산장치들이 병 렬로 동작하도록 자료전송을 
조종한다. 이것은 매개 병렬산수연산장치에 대하여 관흐름화를 실현할수 있게 한다. 
이것을 그림 16-14 l 에 4개의 산수-론리연산장치 가 병 렬로 동작하는 경우로 보여 주 
었 다. 

관흐름화된 내 부구성 을 가짐 으로써 병 렬 산수-론리연산장치 의 구성 은 벡 토르처 리 에 
알맞게 되 였다. 조종장치는 모든 원소들이 처 리될 때 까지 순환식 으로 산수-론리연산장치 
들에 벡토르원소들을 주기 위한 경로를 조종한다. 이러한 류형의 내부구성은 단일산수- 
론리연산장치의 구성보다 훨씬 복잡하다. 

벡토르처 리를 위한 또 한가지 방법은 다중병렬처 리장치를 리용하는것 이 다. 이 경우 
에 과제를 여 러 처 리장치 에 나누어 주어 병 렬로 실행할수 있게 하여 야 한다. 이 구성방 
식 은 병 렬처 리 장치들을 조종할수 있게 쏘프트웨어 와 하드웨 어를 잘 리용하기만 하면 그 
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효과가 대단하다. 그러나 이것은 비록 몇가지 제품이 나오긴 했지만 아직 미개척지이다 
[GEHR88]. 

우리 는 제 16 장 제 1 절의 분류를 확장하며 그림 16-15 에서 보여 준것과 같은 이 새 
토운 구성 방식 을 론의한다. 콤퓨터 의 구성 방식 은 하나 혹은 그이 상의 조종장치 의 수에 



단일처리장치 산수 - 고과치병 ssr 1 


다중조종장치 


/\ 

다중처리장치 병렬처리장치 


그림 16-15. 콤퓨터구성의 분류법 

의하여 구별 할수 있 다. 여 러조종장치 라는것 은 다중처 리 장치라는 말을 의 미한다. 선행한 
고찰에 따라 다중처 리장치들은 주어 진 과제에 대하여 협동적으로 동작하므로 병렬처 리 
장치 체계라고 한다. 

독자들은 문헌에서 찾아 보게 되는것과 같은 일부 련관성이 없는 용어들을 알게 될 
것이다. 비록 병렬 ALU 구성방식이 벡토르처리를 목적으로 설계되고 앞에서 이미 론의 
한것 처 럼 병 렬 처 리 장치 의 구성 방식 도 또한 벡 토르처 리 를 위 하여 설 계 되 였 다고 하지 만 벡 
토르처 리 장치 의 구성 방식 이 라고 할 때 그것 은 관흐름 ALU 구성 방식 을 의 미하는것 이 다. 
세 가지 구성 방식가운데서 어 느 하나가 배 렬처 리를 위하여 최적화되 여 있다고 해도 배 렬 
처 리 기본방식은 본질에 있어서 병 렬 ALU 구성 방식이 라고 말할수 있다. 배 렬처 리장치는 
일 반용처 리 장치 들에 증설 되 여 보조적 으로 벡 토르계 산을 담당한다. 배 렬처 리 장치방식 은 
관흐름 ALU 든가 병 렬 ALU 방식 에 리 용할수 있 다. 

최 근에 관흐름 ALU 구성 방식 의 콤퓨터 들이 시 장에 서 주류를 이 루고 있 다. 관흐름체 
계들은 다른 두 방식에 비 하여 덜 복잡하다. 그의 조종장치와 조작체계프로그람들은 다 
원배치 (할당)에서의 효과성과 높은 성능을 보장할 목적 에서 개 발되 였 다. 이 절의 나머지 
부분에서 는 이 방식 에 대 하여 실례 를 들어 좀더 구체 적 으로 설명한다. 


2. IBM 3090 백토르기구 


벡토르처리를 위한 관흐름 ALU 조직의 대표적인 실례로 IBM 370 구성방식을 위 하여 
개 발되 였으며 고성능 IGBM3090 계 렬에서 실현된 벡토르기구를 들수 있다. 이 기구는 기 
본체계에 보충하는 식으로 된 선택품이지만 높은 통합성을 가지고 있다(이 기구는 기본 
체계 에 반드시 장비되 여 있는것은 아니 다.). 필요에 따라 선택하여 확장하는 식 으로 되 
여 있는데 결합이 잘된다. 

IBM 기구는 여러개의 벡토르등록기를 리용하게 되여 있다. 매개 등록기는 실제로 여 
러 개의 스칼라등록기 들의 묶음으로 되 여 있다. 벡 토르더 하기 C=A+B 를 계산하기 위하여 
벡토르 A 와 B 가 두개의 벡토르등록기에 넣어 진다. 다시 이 등록기로부터 출력된 자료 
들은 가능한 높은 속도로 ALU 를 통과한 다음 (ALU 에 연산된 다음) 그 결과가 세 번째 
벡토르등록기에 넣어 진다. 계산은 반복계산과 블로크안의 등록기에 입력자료의 넣기조 
작을 일반 ALU 조작보다 훨씬 더 빠른 속도로 진행하여 결과를 출력한다. 
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M 벡토르기본방식과 그와 류사한 관 
인로 성능제고를 보장하는데 여기에나 

벡토르자료구조가 고정되여 있으면 
명 령들을 보다 더 빠른 내부(하드 ; 
로 바물수 있게 한다. 

여 러개의 순차적 인 벡 토르원소(요 
조작에서와 같이 병행으로 하든가 
수행 한다. 

• 중간결과를 기억하는데 벡토르등내 
수 있다. 

그림 16-16 에 벡토르기구의 일반적구성 
- 분리되여 있으면서 처 리장치에 보충적으 
경방식은 System /370 의 연장이며 이와 호 
보 으로 System /370 에 통합되 여 있 다. 


칼라산수명 

- 순환내4 
1 계 조작 (연 

산수 연산은 











• 현존 System /370 명 령 들은 모든 스칼라연산에 리 용된 다. 

• 개별적벡토르원소에 대한 산수연산은 대응하는 System /370 스칼라명령에 의하 
여 얻은 결과와 완전히 같다. 례하면 설계에서 한가지 문제가 류점수나누기연산 
결과에 서 의 관심 사로 되였다. 결과가 정 확해 야 한다면 스칼라류점 수나누기 를 해 
야 하며 혹은 근사계산을 해도 된다면 높은 속도는 실현할수 있지만 때때로 아 
태자리비트에서 하나 혹은 여러개의 비트가 오유로 될수 있지 않겠는가? 이 결 
정은 성능에서 손실을 적게 보면서도 System /370 과 완전한 호환성을 보장할수 
있게 하였다. 

• 벡 토르명 령 들은 새 치 기 할수 있 으며 그에 대 한 례 외 처 리 는 System /370 프로 
그람새 치 기방식과 호환성 있게 해 당한 동작을 취 한후 새 치 기점 에서부터 다 
시 시작한다. 

• 산수연산례외처리들은 System /370 의 스칼라산수명령과 같거나 그의 확장이거나 
또는 례외처리로 되여 있으며 류사한 고정루린(보조프로그람)을 리용할수 있다. 
이것을 관리하기 위하여 례외처리에 의하여 영향을 받는(례하면 자리넘침)벡토르 
등록기 안의 주소를 지 적 하는 벡 토르새 치 기 참조부가 리 용된다. 따라서 벡 토르명 령 
의 례외처리가 다시 시작될 때 벡토르등록기안의 해당한 위치가 접근된다. 

• 벡토르자료는 표준방법으로 조종되는 폐지기정값을 가진 가상기억기안에 존재한다. 

이러한 준위에서 통합은 일련의 우점을 가지고 있다. 현존조작체계들은 크게 확장하 
지 않고 벡토르기구를 지원할수 있다. 현존응용프로그람들，언어를파일러들과 다른 쏘프 
트웨어 들도 갱 신하지 않고 그대 로 실행 할수 있 다. 벡 토르기 구를 리 용할수 있는 쏘프트웨 
어 를 희 망에 따라 변경할수 있 다. 

등록기 

벡토르기구의 설계에서 기본항목은 연산수가 등록기안에 있는가 기억기안에 있는가 
하는것 이 다. IBM 내 부구성 을 등록기-등록기방식 이 라고 하는데 그 리 유는 벡 토르연산수에 
대한 입력과 출력이 벡토르등록기들안에서 단계별로 진행되기때문이다. 이 방법은 크레 
이 슈퍼 콤퓨터 에 서 또한 실 현되 였 다. 콘트롤데 이 터 콤퓨터 에 서 리 용된 방식 은 기 억 기 로부 
터 연산수를 직 접 얻 게 되 여 있 다. 벡 토르등록기리 용의 우점 은 프로그람작성 자라든가 콤 
파일러작성 자가 그것들을 마음대로 쓸수 있다는것 이 다. 례하면 벡 토르등록기의 길이가 
K 이고 처리되는 벡토르의 길이가 N>K 이라고 하자. 이 경우 벡토르순환이 진행되여야 
하는데 여기 에서 한번에 K 개의 원소에 대한 조작이 진행되며 N/K 번 순환이 반복된다. 
벡토르등록기방식의 주요한 우점은 연산속도가 뜬 주기억기 에서 진행되지 않고 대신 주 
로 등록기 들과 진행하는것 이 다. 

등록기를 리용하여 실현할수 있는 속도제고를 그림 16-17 에서 보여 주었다. 그림에 
있는 포트란프로그람은 벡토르 A 와 벡토르묘 를 곱하여 벡토르 C 를 얻은것으로서 여기에 
서 매개 벡토르는 실수부 ( AR ， BR , CR ) 와 허수부 ( AI , BI , CI ) 를 가진다. 3090콤퓨터는 하 
나의 처 리 장치 가 박자 혹은 주기 (읽 기 , 쓰기 ) 마다 주기억 접 근을 할수 있 으며 주기 마다 읽 
기 인 경 우는 두번 접 근，쓰기인 경 우는 한번 접 근을 할수 있는 등록기 들을 가지 는것 과 함 
께 론리연산장치에서는 한주기에 하나의 결과를 만들수 있다. 두개의 원천연산수와 하나의 
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그림 16-18 은 IBM 3090 백토르기구의 한 무분인 등록기들몰 보여 준다. 
의 32 bit 등록기가 있다. 벡토르등록기는 또한 호상 결합되여 8개의 64 bit 
있다. 임의의 등록기들은 옹근수값이든가 류점수값을 취할수 있다. 따라니 
들은 32 bit 와 64 bit 옹근수값과 32 bit 와 64 bit 의 류점 수값을 보관하는데 리 



이 구성 방식 은 매 개 등록기 가 8-512 개의 스칼라요소들을 
고 있다. 실지길이의 선택에서는 설계에서 동시에 실현할수 
토르연산을 수행하는 시 간은 구체적으로는 관흐름시작(동작의 
한 내부처 리시간과 벡토르원소에 대 한 한주기시 간으로 구성되 
록기요소들을 리용하면 계산에 필요한 상대적시작시간을 줄일 
프로쎄스의 절환에 따르는 벡토르등록기들의 보관과 복귀를 
간과 실제적인 가격과 공간의 제한성과의 관계에서 균형을 보 
에 기 초하여 현행 3090 를퓨터 를 실현할 때 등록기 당 128 개 요 
벡토르기구를 구성함에 있어서 세개의 등록기를 더 보충« 
스크등록기 는 벡 토르등록기안의 어 느 요소들을 특별 한 조작 H 
는가 하는것을 선택하는데 리용되는 마스크비트들로 구성되。 
벡토르계수와 갈은 조종마당으로 되여 있는데 이것은 백토 
들이 처 리 되 였는가 하는것 을 결정한다. 벡 토르동작계수(등』 











첩시켜 야 한다. IBM /370 의 벡 토르기구설계 자들은 여 러 가지 리유로부터 이 가능성을 고 
려 하지 않았다. System /370 구성 방식 (가상기 억 기 관리 에 의 한 효과를 비 롯하여 )은 복잡한 
새 치기를 조종하기 위하여 확장하지 않으면 안되 였으며 이 에 대 응 하여 쏘프트웨 어의 변 
화가 요구되였다. 보다 기본으로 되는 문제는 발생된 련쇄에 따르는 벡토르기구안에서 
조종장치 와 등록기 접 근경 로의 보충으로 인 한 가격문제 이 다. 

그대신 세가지 조작이 제공되고 있는데 그것은 벡토르계산에서 제일 많이 쓰이는 
과정 인 더 하기，덜기 에 의한 곱하기연산이든가 혹은 합계산을 하나의 명 령 (조작코드)으 
로 결합하는것 이 다. 례 하면 기 억기-등록기 MULTIPLY - AND-ADD 명 령은 기 억기 로부터 
벡토르를 꺼내여 그것을 등록기에 있는 백토르와 곱한 다음 그 적을 등록기안의 세번째 
벡 토르에 더 한다. 그림 16-17 의 실례 에서 합성명 령 MULTIPLY - AND-ADD 와 
MULTIPLY - AND-SUBTRACT 를 리 용함으로써 반복하는 전체 시간은 10 으로부터 8 로 
줄어 들게 된다. 

련쇄과정과는 달리 합성명령은 중간결과를 림시기억하기 위하여 등록기를 더 보충 
할 필요는 없으며 이것들은 등록기접근보다 하나 적게 요구한다. 례를 들어 다음과 갈은 
련쇄과정을 보기로 하자. 

A_;VR1 
VR 1+ VR 2 수 VR 1 

이 경우 벡토르등록기 VR 1 에 두번의 기억이 요구된다. IBM 구성방식에는 기억기-등록 
기 ADD 명령이 있다. 이 명령에 있어서 합은 오직 VR 1 에 넣어 진다. 합성명령은 또한 여 
러개의 명령의 동시집합을 기계상태로 서술하는데서 제기되는 요구들을 피할수 있으며 그로 
하여 조작체계와 새치기조종에 의하여 생기는 보장과 복귀의 상태를 간소화할수 있다. 

명령모임 

표 16-13 은 벡 토르방식 을 위하여 정의된 산수-론리연산명 령 을 종합한것 이 다. 여기 에 
기 억기-등록기넣기와 등록기-기 억기쓰기명 령 이 더 보충되 여 있다. 참고할것은 대부분의 
명령들이 세개의 연산수형식을 취한다는것이다. 또한 일부 명령들은 연산수의 주소에 따 
라 여 러 가지 종류가 있다. 원천연산수는 벡 토르등록기 ( V )，기 억 기 ( S ) 든가 혹은 스칼라등 
록기 (必가운데서 어 느 하나로 된다. 목적지 (결과를 넣 는곳)는 비 교명 령 을 제 외 하고는 
항상 벡 토르등록기이 며 결과는 벡 토르마스크등록기 에 들어 간다. 이 모든 종류를 고려하 
면 전체 조작코드의 수는 171 개 이다. 일단 기계가 산수연산장치와 자료통로를 기 억기， 
스칼라등록기，벡 토르등록기 로부터 벡 토르관흐름에 로 연산수를 전송하는데 리용된다면 
주요한 하드웨어가격에서 문제가 제기된다. 그 구성방식은 가격에서 별반 차이 없이 이 
등록기들과 관흐름들의 리용에 대한 풍부한 명령의 종류를 제공할수 있다. 

표 16-3 에 있는 대부분의 명 령 들은 명 백하다. 두개 의 합계 산명 령 은 설명 을 더 명 백 
히 해 준다. 축적연산은 하나의 백 토르요소 ( ACCUMULATE ) 라든가 두개 벡 토르의 적 에 
대 한 요소 ( MLLTIPLY - AND - ACCUMULATE ) 와 함께 더한다. 이 명 령 들은 흥미 있는 
설 계문제 를 제 기 한다. ALU 관흐름의 우점 을 충분히 발휘 하여 이 연산이 가능한 빨리 실 
행되게 하는것이 필요하다. 여기서 어려운 문제는 관흐름안에 있는 두수의 합을 여러 주 
기 동안 리 용할수 없는것 이 다. 따라서 벡 토르의 세번째 요소는 그 두 요소가 전체 관흐름 
을 통하여 출력 될 때 까지 첫 두 요소의 합을 더할수 없는것 이 다. 이 문제 를 극복하기 위 
하여 벡 토르요소들은 4개의 부분합을 만드는 방법 으로 더하게 된다. 특히 요소 0, 4, 8, 
12，..%124는 부분합 0을 만들기 위하여，요소 1, 5, 9, 13, •••，내크는 부분합 1 을 만 
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들기 위 하여 그리 고 요소 3, 6, 11，15, •••,127 은 부분합을 만들기 위 하여 더 해 진다. 이 
개 개의 부분합은 높은 속도로 관흐름을 통하여 진행할수 있는데 그것은 관흐름안에서의 
지 연은 대체 로 4 주기정도이기때 문이 다. 개 별적 인 벡 토르등록기들은 부분합을 취 하는데 
리용된다. 원천벡토르의 모든 요소가 처리되였을 때 4 개의 부분합은 함께 더해 져 최종 
결과를 얻는다. 이 두번째 과정의 수행은 문제로 되지 않는데 그것은 오직 4개의 벡토르 
요소만이 포함되여 있기때문이다. 

표 16-3. IBM 3090 벡 토르성 능: 산수 및 론리연산명 령 _ 

자료형 


류점수 


조작 

긴 

형 

짧 

2 진 
혹은 
론리형 


연산수위 치 


더하기 

FL 

FS 

BI 

V +V — V 

V + S — V 

Q +V — V 

Q + S —V 

덜기 

FL 

FS 

BI 

V-V — V 

V - S — V 

Q-V — V 

Q - S —V 

곱하기 

FL 

FS 

BI 

V X V — V 

V X s — V 

Q X V — V 

Q 父 S — V 

나누기 

FL 

FS 

— 

v / v^v 

V/S — V 

Q / V^V 

Q / S^V 

비교 

FL 

FS 

BI 

V • V — V 

V • S — V 

Q • V — V 

Q-S —V 

곱한 다음 더하기 

FL 

FS 

— 


V+VXS 나 V 

V + QXV— V 

V+QXS 나 V 

곱한 다음 덜기 

FL 

FS 

— 


V - VXS— V 

V - QXV—V 

V - QXS—V 

곱한 다음 축적 

FL 

FS 

— 

P +. V—v 

P + • S — V 



보수 

FL 

FS 

BI 

- V — V 




정의 절대값 

FL 

FS 

BI 

ivl—v 




부의 절대값 

FL 

FS 

BI 

-ivl — V 




최대 

FL 

FS 

— 



Q. V — Q 


최대절대값 

FL 

FS 

— 



Q. V — Q 


최소 

FL 

FS 

— 



Q. V — Q 


론리왼쪽밀기 

— 

— 

LO 

• V — V 




론러오른쪽밀기 

— 

— 

LO 

• V — V 




론리 곱하기 

— 

— 

LO 

V&V — V 

v&s^v 

Q&V — V 

Q &S — V 

론러더 하기 

— 

— 

LO 

V I V — V 

V I S — V 

Q 1 V — V 

Q 1 S — V 

안맞음론리더하기 

- 

，타 

LO 

V® V — V 

V0S — V 

Q0 V — V 

Q®S — V 


해설: 자료형 

연녀 

또수위 치 

FL 

긴 류점수 

V 

벡 토르등록기 

FS 

짧은 류점수 

S 

기억장치 

BI 

2 진옹근수 

Q 

스칼라(일반 혹은 류점수등록기 ) 

LO 

론리값 

P 

벡토르등록기에서 부분합 
특수 연산 
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련습문제 

1. a 는 n 개의 처 리 장치 에 의하여 동시 에 실행할수 있는 프로그람의 퍼센트라고 
하자. 나머지코드가 단일처 리 장치 에 의하여 순차적 으로 실행되 여 야 한다고 하자. 
매 개 처 리 장치 가 x MIPS 의 실 행 속도를 가진 다. 

T . a，n 그리고 x 의 견지에서 이 프로그람의 독점적실행을 위한 체계를 리용할 
때 유효한 MIPS 속도에 대 한 식을 유도하시오. 

L . n =16 이고 x =4 MIPS 의 체계전송을 실현할수 있는 a 의 값을 결정하시오. 

2. 8 개의 처리장치로 된 다중처리장치체계는 20 개의 접촉식레프구동기를 가지고 
있다. 실행을 완성하기 위하여 각각 4 개의 레프구동기를 요구하는 체 계에 모든 
수의 일감이 제기된다. 매개 일감은 그 조작의 완료를 위하여 짧은 기간에 4 번 
째 구동기 를 요구하기전에 오랜 세개의 테 프구동기 만으로 실행 을 시 작한다고 
하자. 또한 그러한 일 감이 무한히 들어 온다고 하자. 

자.조작체계의 일정작성기가 4 개의 레프구동기가 유용하지 않으면 일감을 시작하지 
않는다고 하자. 일감이 시작되면 4 개의 구동기는 즉시에 할당되며 일감이 끝날 
때까지 놓지 않는다. 한번에 진행할수 있는 일감의 최대수는 얼마인가? 이 방식의 
이 결과에 의하여 남아 있는 레프구동기의 최대수와 최소수는 얼마인가? 

레프구동기의 리용률을 개선하며 갈은 시간에 체계의 봉쇄 (막힘)를 피하기 
위하여 새로운 방식을 제기하시오. 한번에 진행할수 있는 일감의 최대수는 
얼 마인가? 작업하지 않는 레 프구동기 수의 한계 는 얼 마인가? 

3. 모선에 기 초한 다중처 리 장치 에 대 한 한번쓰기 캐 쉬방식 에 서 어 떤 문제 를 주목할 
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수 있는가? 그렇 다면 그의 풀이를 제기하시오. 

두 대칭다중처리장치구성에서 두처리장치가 주기억기로부터 자료의 갈은 행에 대 
한 접근을 요구하는 조건(환경)을 고찰하자. 두 처리장치는 하나의 캐쉬를 가지고 
MESI 규약을 리용한다고 하자. 처음에 두 캐쉬는 그 행에 대한 무효복사를 한다. 
그림 16-19 에 처 리 장치 P 1 에 의 하여 행 X 를 읽 는 과정 을 보여 주었 다. 


주기 억 기 



£ 卜 © Q) 

그림 16-19. 처리소자의 행 표를 읽기 

이것이 접근과정에 대한 시작이라면 다음의 과정을 순서대로 그리시오. 

1 . P 2 는 X 를 參! 는다 

2. P 2 는 X 에 쓴다에 에 캐 쉬안의 행 을 표시 ) . 

3. P 1 은 X 에 쓴다에 에 캐쉬 묘 안의 행을 표시). 

4 . P 2 는 X 를 읽 는다. 

그림 16-20 에 가능한 캐 쉬 일 치 성 규약을 두개 의 상태 도로 보여 주었 다. 매 개 규 
약을 추리 하고 설명한 다음 MESI 와 각각 비 교하시 오. 

MESI 규약을 리용하는 L 1 과 L 2 캐쉬를 가진 대칭 다중처 리장치에 대하여 보기로 하자. 
제 16 장 제 3 절에서 설명한것처럼 4 개 상태가운데서 하나는 L 2 캐쉬 안의 매개 행과 
관련되여 있다. L 1 캐쉬의 매개 행에 대하여 4 개 상태가 다 필요되는가? 그렇다면 왜 
그런가? 그렇지 않다면 상태나 상태들을 소거해도 될수 있다는것을 설명하시오. 

표 16-1 은 IBMS /390 에 대한 3 준위 캐쉬배렬에 의하여 얻어 지는 성능을 보여 준 
다. 이 문제의 목적은 세번째 준위의 캐쉬를 포함시키는것이 가치가 있겠는가를 결 
정하는것이다. L 1 캐쉬만을 가지고 있는 체계에 대한 접근(처리장치주기의 평균수) 
를 결정 하고 그 값을 1.0 까지 정규화하시오. 그다음 L 1 과 L 2 캐쉬를 둘다 리용했을 
때 정규화된 접근위반과 세 캐쉬를 다 리용했을 때의 접근위반을 결정하시오. 매개 
캐쉬에서 개선된 량을 참고로 하여 L 3 캐쉬값에 대한 독자의 견해를 말하시오. 

다음의 코드토막은 벡 토르산수연산식 

■ A ( I )+ B ( I ) XC ( I ) ( 0호 I . S 63 인 경우) 

을 평 가하기 위하여 64번의 실행 이 필요하다. 

Load Rl, B(I) /R1 — Memory ( a+1)/ 






Load R2, C(I) 
Multiply Rl, R2 
Load R3, A(I) 
Add R3, R1 
Load Dl, R3 


/R1 •— Memory (0 +1)/ 
/R1 ᅳ (R1)X (R2) / 

/R1 — Memory (r +1)/ 
/Rl— (R3)X (Rl)/ 
/Memory 9 •누 (R3) / 


여기서 Rl , R 2 와 R 3 은 처리장치안의 등록기들이며 a ，)3, r ,0 는배렬 B ( I ), 
C ( I ), A ( I ) 및 D ( I ) 의 개개 에 대 한 주기억기 안의 시작주소이 다. 매개 읽기，쓰 
기 에 4박자주기，더 하기 에 두박자주기 ， SIMD 기 계안에 서 단일 처 리 장치 혹은 하 
나의 처 리 장치 에 서 곱하기 를 위하여 8박자주기 라고 하자. 

1 .SISD 단일처 리장치콤퓨터에서 이 토막을 순차적으로 그리고 반복하여 
64 번 실행하는데 요구되는 처리장치의 전체 박자주기수를 계산하시오. 
이 때 다른 시 간지연을 무시한다. 

i _.64 개의 벡토르자료에 대하여 6 개의 동기화된 벡토르명 령안의 벡토르연 
산을 실 행 하기 위하여 64 개 의 처 리 요소를 가진 SIMD 콤퓨터 의 리용을 
설명 하시오. 그러고 SIMD 기계의 전체 실행기간을 계산하시오. 명 령알림 
과 다른 지 연은 무시한다. 

n.SISD 콤퓨터에 비하여 SIMD 콤퓨터의 속도려득은 얼마인가? 



9. 다음의 프로그람을 벡토르화하시오. 

10. 단일처 리장치는 스칼라방식과 벡 토르방식 에서 동작할수 있다. 계산속도는 벡 토 
르방식에서 10배 더 빠르다. 성능검사프로그람을 가지고 이 콤퓨터 에서 시간 T 
를 측정하였 다. 이 시 간에 서 25%는 벡 토르방식 이 고 나머 지 는 스칼라방식 이 다. 
ᄀ.우에서 언급된 조건에서 벡토르방식을 리용하지 않는 경우와 비교하여 
유효속도제 고비 를 계 산하시 오. 또한 앞의 프로그람에 서 (백 토르방식 을 러 
용하기 위하여 번역된) 벡 토르화된 코드의 퍼 센트인 a 를 구하시 오. 

L . 하드웨어를 개량함에 따라 벡토르방식과 스칼라방식사이의 속도비가 배 
로 된다는것을 설명하시오. 얻어 진 유효속도제고비를 계산하시오. 
n . l 에 서 엄 어 진 속도제 고비 가 하드웨 어 를 개 량하는것 보다 콤파일 러 를 개 
량하여 얻을수 있다는것을 설명하시오. 갈은 성능검사프로그람에 비하여 
콤파일러 에 의하여 지 원 받을수 있는 벡 토르화비 a 는 얼마인가? 
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부록 I . 수자론리 

수자형를퓨터의 연산은 2 진자료에 대한 기억과 처리에 기초하고 있다. 이 책에서는 
처 음부터 두개 의 안정 상태가운데 서 한 상태 에 놓일 수 있는 기 억 요소와 콤퓨터 의 각이한 
기 능을 실현하기 위한 조종신호의 조종밑 에 2 진자료에 대 한 연산을 진행할수 있는 회 로 
가 있다고 보고 설명을 해왔다. 이 부록에서는 이러한 기억요소와 회로가 조합회로와 순 
서회로와 같은 수자론리로 어떻게 실현되는가에 대하여 본다. 부록에서는 먼저 불대수를 
개 괄적 으로 고찰하는데 이것은 수자론리의 수학적기초로 된다. 다음으로 문회 로의 개 념 
을 고찰하고 마지막으로 문회 로로 구성되는 조합회 로와 순서회 로에 대 하여 해설한다. 

제 1 절. 불대수 

수자형를퓨터 및 다른 수자체계에서 쓰이는 수자회로는 불대수로 알려 진 수학리론 
에 의하여 설계되며 그 동작이 해석된다. 이 이름은 영국의 수학자 죠지 불 (George 
Boole) 에 대한 경의의 표시로 단것 이다. 그는 이 대수학의 기본원리를 1854 년에 그의 론 
문 론러 및 확률의 수학적리론을 창시하기 위한 사유의 법칙에 대한 연구에서 제 안하였 
다. 1938 년에 MIT 에서 전기공학과 연구조수로 있던 콜라우드 샤논 (Claude Shannon) 은 계 
전기절환회 로의 설 계문제 를 해 결하는데 이 불대 수를 리용할수 있 다는것 을 제 기하였 다 
[SHAN38] . 샤논의 수법은 그후 수자전자회로의 설계와 해석에 리 용되였다. 불대수는 
두 분야에 서 편리한 도구로 되 였 다. 

• 분석 : 수자회로의 기능을 서술하는 경제적인 방도이다. 

• 설계 : 필요한 기능이 주어 진 경우 그 기능을 간단하게 실현하는데 불대수를 적 
용할수 있다. 

임의의 대수와 마찬가지 로 불대수도 변수를 리용하여 연산을 한다. 불대수인 경우 
변수와 연산은 론리변수와 론리연산으로 된다. 변수는 1( 참) 또는 0( 거 짓)이 라는 값을 
취 함수 있다. 기본론리연산에는 론리곱하기 (AND), 론리더 하기 (OR) 및 론리부정 (NOT) 
이 있는데 이것들은 각각 점，+기호 및 웃막대기와 같은 기호로 표시된다. 

A AND B = A • B 
A OR B = A + B 
NOTA = A 

AND 연산은 량쪽 연산수가 다 참일 때 에만 참 (2 진값 1) 을 엄게 된다. OR 연산은 참가하 
는 연산수가운데서 어느 하나 또는 량쪽이 참일 때 참이 라는 결과를 준다. NOT 연산은 
그의 연산수값을 반전시킨다. 실례로 다음식을 고찰해 보자. 

D = A + (豆 + C ) 

A 가 1 이거 나 혹은 B=0 이고 C =1 이면 D 는 1 이 된다. 그렇지 않으면 D 는 0 이 다. 
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표 1-1. 불연산자 


P 

Q 

NOTP 

PANDQ 

PORQ 

PXORQ 

PNANDQ 

PNORQ 

0 

0 

1 

0 

0 

0 

1 

1 

0 

1 

1 

0 

1 

1 

1 

0 

1 

0 

0 

0 

1 

1 

1 

0 

1 

1 

0 

1 

1 

0 

0 

0 


표기법에 대하여 몇가지 점을 설명할 필요가 있다. 괄호가 없는 경우에는 AND 연 
산이 OR 연산보다 우선적 이 다. 또한 모호한것 이 없으면 점연산자대 신에 변수들을 그냥 
련결 하여 표시할수 있 다. 즉 

A + B«C = A + ( B « C ) = A + BC 

우의 식들은 모두 B 와 C 의 AND 를 진행 하고 그다음 그 결과와 A 의 OR 를 취 한다는것 
을 의 미한다. 

표 1-1 은 진리 값 표로 알려 진 형 식 으로 기본론리연산들을 정 의 하고 있 다. 이 진리값 
표는 단순히 연산수값의 모든 가능한 조합에 대하여 그 연산값을 목록화한것 이 다. 표에 
서 는 다른 3 가지 쓸모 있는 연산자인 안맞음론리 더 하기 (XOR), 론리 곱하기 부정 (NAND) 
및 론리 더 하기부정 (NOR) 에 대 해서도 목록화하였다. 두 론리 연산수의 XOR 는 두 연산수 
가운데 서 어 느 하나만 값 1을 가질 때 1이 된다. NAND 기 능은 AND 기 능의 부정 (NOT) 
이 고 NOR 는 OR 의 부정 이 다 . 

A NAND B = NOT(A AND B ) = AB 
A NOR B = NOT(A OR B ) = A + B 


이 3 가지 새 로운 연산은 어 떤 수자회 로를 실현하는데 효과적 으로 쓸수 있 다. 

표 1-2 는 불대 수의 기 본항등식 들을 정 리 한것 이 다. 식 들은 AND 와 OR 연산의 상보적 
및 쌍대적성질을 보여 주기 위하여 두줄로 배렬하였다. 두 종류의 항등식들이 있는데 하 
나는 증명없이 식으로 표시된 기본규칙 (또는 기본원리) 이고 다른 하나는 기본원리 로부터 
유도될수 있는 항등식 이다. 


표 1-2. 불대수의 기본항등식 


기본원리 


A+B= 公 +A 

교환법칙 

A • (B + C) = (A • B) + (A • C) 

A + (B • C) = (A + B) • (A + C) 

분배 법칙 

1* A = A 

0 + A = A 

동일요소 

A* A = 0 

A +A = 1 

반전요소 

다른 항등식 

0*A = 0 

1 + A = 1 


A* A = A 

A + A = A 


A • (B + C) = (A • B) • C 

A + (B + C) = (A + B) + C 

결합법칙 

A • B = A + B 

A+B=A*B 

데모르간의 정리 


기 본원 리 들은 불표현식 을 해 석할수 있는 방법 을 정 의한다. 두개 의 분배법 칙가운데 서 하 
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나는 초등대수학에서의 것과 다르기때 문에 주의 하여 야 한다. 

A + (B • C) W:(A + B) • (A + C) 

표 1-2 의 맨 아래에 있는 두개의 식은 데모르간 (DeMorgan) 의 정리라고 한다. 이 식들 
은 다음과 같이 다시 쓸수 있다. 

anorb = Kand 豆 
anandb = Kor 豆 

독자들이 변수 A, B 및 C 에 대 하여 실제 적 인 값 (1 및 0) 을 대 입하는 방법 으로 표 
1-2 의 식 들을 검 토해 보기 바란다. 


제 2 절. 문회로 

모든 수자론리 회 로의 기 본조립 블로크는 문회 로이 다. 론리 함수는 문회 로들의 호상 
련결에 의하여 실현된다. 

문회로는 그의 입력신호들에 대한 간단한 불연산결과를 출력신호로 내보내는 전자 
회 로이다. 수자론리 에서 쓰이 는 기 본문희 로에 는 AND, OR, NOT, NAND 및 NOR 등이 
있다. 그림 1-1 에는 이 5 가지 문회 로들을 보여 주었 다. 매 개 문희 로는 도형기 호，대수 
적표기법 및 진리값의 3 가지 방법으로 정의된다. 여기에서와 부록전반에서 쓰이는 기호 
는 IEEE 표준 (IEEE 표준 91) 에 준한것 이 다. 반전 (NOT) 연산은 작은 동그라미 에 의 해 표시 
된 다. 

매개 문회로는 하나 또는 두개의 입구와 하나의 출구를 가진다. 입구에서 값이 변 
화될 때 문회로를 통한 신호는 전달지연시간만큼 지연되여 거의 동시에 정확한 출구로 
나간다. 이때의 지 연을 문희 로지 연이라고 한다. 이 문제의 중요성 에 대 해서는 부록 I 의 
제 3절에서 보게 된다. 

그림 1-1 에 보여 준 문희 로외 에 3, 4 개 또는 그이상의 입구를 가진 문회 로도 쓸수 
있다. 즉 X+Y+Z 는 3개의 입구를 가진 OR 문회 로로 실현할수 있다. 

보통 회로실현에서 모든 문희로류형들이 다 쓰이는것은 아니다. 한두가지 류형의 
문희로만 리용하면 설계와 제작이 보다 간단해 진다. 이로부터 문회로의 함수적완비계를 
정 하는것 이 중요하다. 이 것은 임의의 불함수를 이 완비계 에 속하는 문희 로만 리용해도 
실 현 할수 있 다는것 을 의 미한다. 다음문회 로의 조합은 함수적완비 계 를 이 룬다. 

• AND, OR, NOT 

• AND, NOT 

• OR, NOT 

• NAND 
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NOT 문회 로는 그것 들이 불대 수의 3 가지 연산을 표시 하므로 ᄀ 
이 명 백하다. AND 와 NOT 문회 로가 함수적완비 계 를 이 루자면 
OR 연산을 합성하는 방법 이 있어 야 한다. 이것은 데 모르간의 
• 있다. 즉 _ 

A + B = K •豆 

A OR B = NOT((NOT A) AND (NOT B)) 

NOT 연산은 그것 들을 AND 연산을 합성하는데 리 용할수 있 으므 

NAND 문회 로 하나만으로 어 떻게 AND , OR 및 NOT 함수를 실， 
그림 1-3 역 시 NOR 문회 로를 리용하는 경 우 이 에 대 하여 보<= 
수자회 로를 때 때 로 NAND 문희 로나 NOR 문희 로 단독으로 구 




론리회로를 실현하기 위한 조립블로크로 어떻게 리용될수 있는가를 서술하려고 한다. 



제 3 절. 조합회로 

조합회로는 호상 련결된 문회로들의 묶음으로 된 회로이다. 이 회로의 어떤 순간의 
출력신호는 바로 그 순간의 입력신호들만의 함수로 된다. 하나의 문희로에서와 같이 조 
합회로에 입력신호가 가해 지면 문회로지연만큼 지연될뿐 거의 즉시에 출력신호가 나타 
난다. 

일반적으로 조합회로는 n 개의 2진입구와 m 개의 2진출구로 이루어 진다. 하나의 문 
회로와 같이 조합회로는 세가지 방법으로 정의될수 있다. 

• 진리값표: 있을수 있는 2 n 개의 모든 입 력신호조합에 대 하여 개 개의 m 개 출력신 
호를 2진값으로 표에 목록화한다. 

• 도형표시: 문회로의 호상련결배치를 보여 준다. 

• 불식 : 매 개 출력 신호를 입 력신호들에 대 한 불함수로 표현한다. 

1. 불함수의 실현 

임의의 불함수는 문회로의 망과 갈은 전기적형태로 실현할수 있다. 임의의 주어 진 
함수에 대 한 여 러 가지 실현방도들이 있다. 불함수가 표 1-3 의 진리 값표에 의하여 제시되 
였 다고 하자. 이 제 이 함수를 F 가 1 이 되 게 하는 A , B 및 C 의 값들의 조합으로 간단히 
항목화하여 표시할수 있 다. 

F = ABC + ABC + ABC (1-1) 

F 가 1 이 되는 입력값들의 결합에는 3 가지가 있으며 이 결합들중 임의의 하나가 일어 
나면 그 결과는 1 로 된다. 이러한 형태의 표시를 적의 합 ( SOP:Sum Of Product ) 형식이라고 
한다. 그림 1-4 에는 AND , OR 와 NOT 문회 로들로 실현한 간단한 형 태를 보여 주었다. 
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이것을 합의 적 ( POS : Product Of Sum ) 형식이라고 하며 그림 1_5 에 보여 주었다. 그림 
에서는 잘 안겨 오게 하기 위하여 NOT 문회 로는 표시하지 않았다. 그대 신 매 개 입 력 신 
호와 그의 부정을 리용할수 있는것으로 하였다. 이렇게 하면 론리도가 간단해 지며 문회 
토에 서 입 력 들을 보다 명 백하게 읽 을수 있 다. 

이 와 같이 불함수는 SOP 또는 POS 형 식가운데 서 어 느 한가지 로 실 현 할수 있 다. 두 
형 식가운데 서 어 느것 을 선택 하는가하는것 은 진 리값표가 출력함수에 대 하여 1 혹은 0 중 
어느것을 더 포함하는가에 따른다고 볼수 있다. SOP 형식은 매개 1 에 대하여 한개의 항 
을 가지며 POS 형식은 매 개 0에 대 하여 한개 항을 가진다. 이와는 다른 고찰도 있다. 

• SOP 나 POS 보다 일반적 으로 진리값표로부터 보다 간단한 불식을 엄 어 낼수 
있 다. 

• 단일 문희 로류형 (NAND 또는 NOR ) 으로 함수를 실 현하는것 이 더 좋다. 


첫번째 점의 의의는 보다 간단한 불식을 쓰면 함수실현에 드는 문회로가 더 적어 
진다는데 있다. 론리함수를 간단화하는데는 대체 로 다음의 3가지 방법을 리용할수 있다. 

• 대수적간단화 

• 칸도표 

• 크와떤-마크라스키표 


대수적간단화 

대 수적간단화는 불식 을 보다 적 은 요소 
를 가진 식 으로 줄이 기 위하여 표 1-2 의 항 
등식의 적용을 동반한다. 실례로 식 1-1 을 다 
시 보기로 하자. 이 식은 일부 공식들을 쓰 
면 다음식과 등가라는것을 알수 있다. 


F = AB + BC 


(1-3) 


웃식은 다음과 같이 보다 간단한 식으로 된다. 

F = B(A + C ) 

이 식은 그림 1-6 에 보여 준것처럼 실현할수 
있다. 식 1-1 의 간단화는 기본적으로 관찰에 
의하여 진행하였 다. 보다 복잡한 식 에 대 해 
서는 어떤 보다 체계적인 고찰방법이 있어야 
한다. 


칸도표 (Karnaugh Map) 

칸도표는 간단화의 목적을 위 하여 보다 
작은 수(4~6)의 변수를 가진 불함수를 표시 
하는 편리한 방법 이 다. 도표는，개의 칸들 

의 배럴로 되여 있는데 그 칸들은 n 개의 2 진변수값들의 있을수 있는 조합을 표시한다. 
그림 1-7 자는 2 변수의 함수인 경우 네개의 칸으로 된 도표를 보여 주고 있다. 앞으로의 
목적 을 위하여 변수들의 조합을 00, 01,11,10 의 순서 로 놓는것 이 편 리하다. 조합에 대 
응하는 칸들이 정보를 기록하는데 쓰이므로 조합들은 습관적으로 칸의 웃부분에 표시된 
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다. 3 변수인 경우에는 표시 가 8 개의 칸들의 배렬 (그림 1-7 의 L ) 로 되는데 이때 한개 
변수에 대 한 값은 왼쪽에 놓이 고 다른 두개 의 변수에 대 한 값은 칸우에 놓인 다. 4변수인 
경우는 16개의 칸이 필요하며 그 배 치는 그림 1-7 도 에 보여 주었다. 



그림 1-7 .불함수를 표현하기 위한 .도표의 리용 
1-F = AB + AB, T- -F = ABC + ABC + ABC, n - 
F = ABCD + ABCD + ABCD, ᄅ-간단한 표기법 

이 칸도표는 다음과 갈은 방법 으로 어 떤 불함수를 표시하는데 쓰인다. 매 개 칸 

들은 적 의 합형 식 에서 고유한 승적항에 대 응되며 주어 진 변수에 대 해서 는 1, 그리 

고 주어 진 변수의 NOT 에 대해서는 0 을 가진다. 따라서 그림 1-7 1에서 승적항 
A 豆는 네번째 칸에 해당된다. 함수에서 이러한 모든 승1에 대하여 해당한 칸에 1 
을 써 넣는다. 그러 므로 2 변수실 례인 경 우 도표는 A 豆 + SB 에 해 당된 다. 불함수의 
진리값표가 주어 지 면 도표를 구성 하기 쉽다. 즉 진 리값에 서 1 의 결과를 만드는 변 
수값의 매 개 조합에 대 해서는 도표의 해 당한 칸마다 1 을 기 입한다. 그림 1-7 느는 

표 1-3 의 진 리값표에 대 한 결 과를 보여 주고 있 다. 불식 으로부터 칸도표로 바꾸자면 

표준형이라고 불리우는 형태로 식을 변환하여야 된다. 표준형이 되자면 식에 포함된 
모든 항에 매 개 변수가 포함되 여 야 한다. 가령 식 1-3 은 먼저 식 1-1 의 완전한 형 태 
로 확장하고 그다음 도표로 변환한다. 

그림 1-7 근에서 쓰인 변수표시법은 변수들과 도표의 행 및 렬사이의 관계를 강조한 
것이다. 여기서 두개의 행은 기호 A 에 의하여 규정되며 거기에 속하는 칸들에서 A 는 
값 1을 가지게 된다. 그리고 기호 A 에 의해 규정되지 못한 나머지 두행에서 A 는 0 이 
된다 ( B , C 및 D 에 대 해서도 마찬가지 이 다.). 
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묶어서 포함하도록 확장할수 있다. 그러면 한개의 렬에서 맨 득대기칸과 맨 아래칸이 린 
접으로 되며 한행에서 왼쪽과 오른쪽 끝에 있는 칸들이 서로 린접으로 된다. 이와 갈은 
관계 를 그림 1-8 의 i • 와 n 에서 설명 하고 있다. 다음으로 두개의 칸들만이 아니 라 2 n 개 
의 칸(4,8 등)들도 묶을수 있다. 그림 1-8 에서 다음 3 개의 실례 (그림 1-8 의 h , n , H ) 
는 4 개의 칸에 대한 묶기를 보여 주고 있다. 이런 경우에는 두개의 변수들이 제거될수 
있다. 마지막 3 개의 실례는 8 개의 칸에 대한 묶기를 보여 준것으로서 이 그룹묶기에서 
는 3개의 변수들이 제거된다. 

이로부터 간단화의 규칙을 다음과 같이 종합할수 있다. 


00 01 11 10 


포© 


00 01 11 10 


% 


그림 1-9. 그룹겹침법 
= AB + BC, L- F = BCD + ACD 


• 표식칸 (1 을 가진 칸)들가운데서 1, 2, 4 또는 8개가 되도록 유일한 가장 큰 블 
로크들을 찾고 그 블로크들을 원형으로 둘러 싼다. 

• 될수록 크게 그리고 될수록 개수가 작게 그러면서도 매 개 표식칸들이 적 어도 
한번씩 포함되 도록 표식칸들의 보충적 인 블로크를 선택한다. 일부 경 우에 는 결 
과들이 유일한것 이 아닐수 있다. 실례로 어떤 표식칸이 정 확히 두개의 다른 칸 
들과 결 합되 고 보다 큰 그룹을 완성 하기 위한 네 번째 표식칸이 없는 경 우 두개 
의 그룹묶음의 선택으로 하나의 선택을 만들수 있게 된다. 그롭을 원형으로 둘 
러 싸는 경우 같은 1을 한번이상 리용할수 있다. 

• 단일 표식칸，린접 표식칸들의 쌍，4개 및 8개 칸들의 그룹 등을 둘러 싸서 원형 
고리 에 들어 가도록 한다. 이와 같은 방법 으로 모든 표식칸들이 적 어도 하나의 
원형 고리 에 포함되 도록 하여 될수록 적 은 수의 블로크들이 모든 표식칸들을 포 
함하도록 한다. 

그림 1-9 가에서는 표 1-3 에 기초하여 이 과정을 보여 주었다. 그룹묶기후에도 고립 
된다면 1 이 남을수 있다. 이때에는 이것들도 각각 1의 그룹으로 보고 원형으로 둘러 싼 
다. 마지막으로 도표로부터 간단화된 불식으로 가기전에 다른 그룹에 의해 완전히 겹쳐 
진 임의의 1 의 그룹은 제외시킬수 있다. 이것을 그림 1-9 l 에 보여 주었다. 이 경우 수 
평 방향묶음이 중복부분으로 되 며 불식 을 작성할 때 무시 된 다. 

칸도표의 또 하나의 특징에 대해서도 언급할 필요가 있다. 일부 경우에는 변수의 
어떤 값조합이 결코 생기지 않으며 따라서 그에 대응한 출력도 결코 생기지 않는다. 이 
것을〈〈무이금지항》조건이 라고 한다. 이런 조건을 가진 매항에 대해서는 도표의 해당한 
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칸에 문자 《 d > 를 써 넣는다. 그룹묶기와 간단화를 진행할 때 매개 《 d 》 는 어느 쪽이 가 
장 간단한 식 으로 되 든지 간에 1 또는 0 으로 취 급할수 있 다. 


표 1-4. 한자러 조임 형 10 진수 하나증가에 대 한 진리 값표 


번호 A 

B 

C 

D 

번호 

W 

X 

Y 

Z 

0 0 

0 

0 

0 

1 

0 

0 

0 

1 

1 0 

0 

0 

1 

2 

0 

0 

1 

0 

2 0 

0 

1 

0 

3 

0 

0 

1 

1 

3 0 

0 

1 

1 

4 

0 

1 

0 

0 

4 0 

1 

0 

0 

5 

0 

1 

0 

1 

5 0 

1 

0 

1 

6 

0 

1 

1 

0 

6 0 

1 

1 

0 

7 

0 

1 

1 

1 

7 0 

1 

1 

1 

8 

1 

0 

0 

0 

8 1 

0 

0 

0 

9 

1 

0 

0 

1 

9 1 

0 

0 

1 

0 

0 

0 

0 

0 

1 

0 

1 

0 


d 

d 

d 

d 

1 

0 

1 

1 


d 

d 

d 

d 

조건에 1 

1 

0 

0 


d 

d 

d 

d 

무관계 丄 

1 

0 

1 


d 

d 

d 

d 

1 

1 

1 

0 


d 

d 

d 

d 

1 

1 

1 

1 


d 

d 

d 

d 

이 문제 는 [ HAYE 88] 에 서 

제 시 된 

실례에서 설명해 

주고 있다. 

이제 

조임형 10 


수에 1을 더하는 회 로에 대 한 불식 을 개 발한다고 하자. 제 9 장 제 2 절 로부터 조임 형 10 
진수에서는 매개 10 진수자를 명시적인 방법으로 4 bit 의 코드로 표시한다는것을 알수 
있 다. 즉 0=0000，1=0001， ••• ，8=1000 및 9=10이 이 된 다. 1010 부터 1111 까지 의 나 
머지 4 bit 값들은 쓰이지 않는다. 이 부호는 2 진식 10 진 ( BCD ) 부호라고도 한다. 

표 1-4 는 4 bit BCD 입구보다 하나이상인 4 bit 결과를 주는 진리값표를 보여 주고 
있다. 더하기는 10 진수더하기 (모둘 10) 이며 따라서 9+1=0 이 다. 또한 6 개의 입구부호 
는 있을수 없는 BCD 입구이므로《무이금지 항》결과를 만들어 낸다. 그림 1-10 은 엄어 
진 매개 출구변수에 대한 칸도표를 보여 주고 있다. 여기서 d 칸들은 가장 좋은 가능 
한 그롭묶기 를 수행하는데 쓰이 였 다. 

크와인-마크라스키 법 

칸도표법은 변수가 4 개이상인 경우 매우 쓰기 불편하다. 5 개의 변수에서는 두개 
의 16 X 16 칸도표가 요구되 며 하나의 도표는 린 접 성 을 달성 하기 위하여 3 차원 에 서 다 
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그림 1-10. 칸도표의 증가법 
= AD + ABCD , L -X = BD + BC + BCD, 
c - Y = ACD + ACD, H -Z = D 


른 도표의 곡대기에 있는것으로 간주해야 한다. 6 변수에 대해서는 4 차원에서 4 개의 16 
X 16 칸도표를 리용하여 야 한다. 칸도표를 대 신하는것 으로는 크와인-마크라스키 
( Quine - McKluskey ) 법 이 라고 불리 우는 표에 의 한 방법 이 있 다. 이 방법 은 최 소화된 불식 
을 작성 하기 위한 자동도구를 주므로 콤퓨터 에서의 프로그람작성 에 도 어 울린다. 

이 방법은 한가지 실례 에 의해서도 잘 설명할수 있다. 이제 다음과 갈은 식 을 보기 
로 하자. 


ABCD + ABCD + ABCD + ABCD + 豆 BCD + 豆 BCD + ABCD + ABCD 

우의 식 이 어 떤 진리값표로부터 유도되 였다고 하자. 이 식을 문회 로로 실현하는데 
알맞는 최소론리식 으로 만들려 고 한다. 

첫 단계 에서는 표를 구성하는데 이때 에 는 표의 매 개 렬을 론리식의 승적항의 하나에 
해 당되 도록 한다. 항들은 부정변수의 개 수에 따라 묶어 진다. 즉 부정 이 없는 항부터 시 
작하여 그러한 항이 있 다면 한개 의 부정변수를 가진 모든 항을 묶는식 으로 해 나간다. 표 
1-5 에서 는 실례 로 受 론리 식의 목록을 보여 준다. 표에서 수평선들은 그룹묶기를 표시하 
는데 쓰이 였다. 명백한바와 같이 매 개 항은 부정 이 아닌 변수에 대 해서는 1, 부정변수에 
대 해서는 0으로 표시하였다. 즉 그것들이 포함한 1의 개수에 따라 항들을 묶었다. 첨수 
렬은 앞으로 써먹게 되는 10진등가수를 그냥 첨부한것 이 다. 
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다음단계는 한개의 변수만 차이나는 항들의 모든 쌍(항들중 한개 항에서 한 변수가 
0 이고 다른 세개는 1 인것을 내놓고는 같은 그런 항들의 모든 쌍)을 찾아 내는것이다. 
이 방법에서는 항들을 그룹화하였기때문에 첫 그룹으로부터 시작하여 그 그룹의 매개 항 
을 두번째 그롭의 매개 항과 비교하는 방법으로 진행할수 있다. 다음에는 두번째 그룹의 
매개 항을 세번째 그룹의 모든 항들과 비교한다. 이러한 방법으로 정합이 발견될 때마다 
매개 항의 뒤에 검사표식을 주며 두 항에서 차이 나는 변수를 제거함으로써 쌍을 뭇고 그 


표 1-5. 크와인-마크4스키방법의 첫 상태 

(실례 로 F = ABCD + ABCD + ABCD + ABCD + ABCD + ABCD + ABCD + ABCD ) 


결과식 

첨수 

A 

c 

D 


ABCD 

1 

0 

0 

1 

사 

ABCD 

5 

0 

1 

1 

V 

ABCD 

6 

0 

1 

0 

V 

ABCD 

12 

1 

0 

0 

V 

ABCD 

7 

0 ] 

L 1 

1 

V 

ABCD 

11 

1 ( 

) 1 

1 

V 

ABCD 

13 

1 ] 

L 0 

1 

V 

ABCD 

15 

1 ] 

L 1 

1 

V 


것 을 새 로운 목록에 첨 가한다. 실례 로 ABCD 와 ABCD 항들은 승적 항 ABC 로 결합된 
다. 이 과정 을 전체 원시표가 모두 검 사될 때 까지 계 속한다. 결과는 다음과 갈은 기 입 
(입구)들을 가진 새로운 표로 된다. 


ACD 

ABC 

abdV 


BCD 사 

ACD 


ABC 

abdV 

bcdV 


이 새로운 표는 첫표와 같은 양식으로 그룹화된다. 두번째 표는 첫번째 표와 같은 
수법 으로 작성 된 다. 즉 한 변수만 차이 나는 항들이 검 사되 여 세번째 표를 위한 새 로운 
항들이 만들어 진다. 

보통 이 프로쎄스는 정합이 없는 표가 만들어 질 때까지 표들에 대하여 련속 진행 
된다. 우리의 경우에는 이 프로쎄스에 3개의 표가 포함된다. 

일단 정확히 작성된 프로쎄스가 완결되면 식의 많은 가능한 항들이 소거된다. 소거 
되지 않은 항들은 표 1-6 에 보여 준것과 같이 행 렬을 구성하는데 쓰인다. 행 렬의 매 개 
행은 지금까지 표에서 쓰인 소거되지 않은(검토가 안된) 항들중 어느 하나에 해 당한다. 
매 개 렬은 본래의 식 에 있던 항들중 어 느 하나에 해 당한다. 렬요소와《 량립성》인 행요 
소들에 대해서는 행과 렬의 매개 사귐점에 X 가 기입된다. 즉 행요소에 있는 변수가 렬 
요소에 있는 변수와 갈은 값을 가진다. 다음으로 렬에서 홀로 있는 X 표식 에 동그라미를 
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친다. 그다음 동그라미를 친 X 표식 이 있는 임의의 행 에서 모든 X 표식 에 직 4각형을 친 
다. 매 개 렬 이 직 4 각형을 친 X 나 동그라미를 친 X 표식을 가지 고 있다면 X 표식을 가 


표 1-6. 크와인-마크라스키방법의 첫 상태 



ABCD 

ABCD 

ABCD 

ABCD 

ABCD 

ABCD 

ABCD 

ABCD 

BD 

X 

X 



X 


X 


ACD 







固 

<8) 

ABC 





固 

0 



ABC 


因 

(8) 






ACD 

因 









(실 례 로 F = ABCD + ABCD + ABCD + ABCD + ABCD + ABCD + ABCD + ABCD ) 

진 행 요소들이 최 소식 을 구성한다. 결국 이 실례 에서 마지 막식 은 다음과 갈다. 

ABC + ACD + ABC + AO ) 

동그라미도 직 4 각형도 못 가진 렬이 있는 경우에는 보충적인 조작이 요구된다. 본 
질 적 으로는 모든 렬 에 X 표식 이 기 입 될 때 까지 행 요소를 보충하게 된 다. 

이 제 왜 그렇 게 되 는가를 직 관적 으로 정 당화하기 위하여 크와인-마크라스키법 을 요 
약해 보자. 조작의 첫 단계 는 상당히 간단하다. 이 프로쎄 스는 승적항에 서 불필요한 변 
수를 제 거한다. 즉 ABC + AB ᄅ 라는 식 은 

ABC + ABC = AB(C + C ) = AB 


이 므로 AB 와 등가이 다. 

변수를 제거한 다음에는 본래식과 명백히 등가인 식이 얻어 진다. 그러나 이 식에 
도 칸도표에서 여분의 항에 대한 그룹묶기를 한것처럼 여분의 항이 있을수 있다. 행렬지 
면배치는 본래의 식에서 매개 항이 보존되고 최종식에서 항의 개수가 최소로 되는 방법 
으로 간단화한다. 


NAND 및 NOR 실현 

불함수의 실현에서 다른 고려사항은 사용되는 문희로의 종류와 관계된다. 불함수를 
NAND 문회로 또는 NOR 문회로만으로 실현하는 문제가 자주 제기된다. 이렇게 하는것 
이 최소문희로실현으로 되지 않을수도 있지만 이것은 규격화라는 우점을 가지며 제조공 
정 을 간단화할수 있 다. 다시 식 1-3 을 보기 로 하자. 

F = B(A + C ) 

어떤 값의 부정의 부정은 바로 그 본래의 값과 갈으므로 웃식은 다음과 갈다. 

F = B(A + C ) = ( AB ) + ( BC ) 

데모르간의 정리를 적용하면 
F = ( AB )«( BC ) 
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로 되며 결국 그림 1-11 에 보여 준것과 같이 이 함수는 3 개의 NAND 문회로로 실 



그림 1-11. 표 1-3 의 NAND 실현 그림 1-12. 4 입구 1 출구다중선택 기 표현 


2. 다중틍로기 

다중통로기는 다중입구를 하나의 출구에 이 어 주는 회로이다. 어떤 순간에 한개의 
입 력신호가 출구에 나가도록 선택된다. 일 반적 인 구성 도를 그림 1-12 에 보여 주었 다. 이 
것 은 4-1 다중통로기 를 표시 하고 있 다. 4 개 의 입 력 신호선은 DO , Dl , D 2 및 D 3 이 라고 한 
다. 이 신호선가운데서 하나가 선택되여 출력신호 F 를 만든다. 4 개의 입구가운데서 하 
나를 선택 하기 위하여 2 bit 선택부호가 요구되며 이것은 S 1 및 S 2 라고 하는 두개의 선택 
신호선에 의하여 실 현된 다. 

표 1-7. 4-1 다중통로기 의 진리 값표 

S2 SI F — 

0 0 DO 

0 1 D1 

1 0 D2 

1_1_ D3 

실례 로 든 4-1 다중통로기는 표 1-7 의 진리값표에 의하여 정의된다. 이것은 진리 값 
표의 간단화된 형식 이 다. 입 력변수의 있을수 있는 모든 조합대 신에 출구를 신호선 DO , 
Dl , D 2 및 D 3 으로부터 의 자료로 보여 주고 있 다. 그림 1-13 에 는 AND , OR 및 NOT 문 
회로를 써서 구성한 회로를 보여 주었다. S 1 과 S 2 는 그것들의 임의의 조합에 대하여 3 
개의 AND 문회로의 출력값이 0 이 되도록 AND 문회로에 련결된다. 이때 네번째 AND 
문회로는 선택된 신호선으로 0 또는 1 값을 내보낸다. 결국 OR 문회로의 3개의 입구는 
언제나 0 이고 OR 문회로의 출구로는 선택된 입구문회로의 값이 나가게 된다. 이런 규격 
화된 구성 을 리 용하면 8-1, 16-1 등의 각이한 형 식의 다중통로기 를 구성 하기 가 쉽다. 

다중통로기는 신호와 자료의 경로를 조종하는 수자회로에서 쓰인다. 한가지 실례로 
는 프로그람계수기 ( PC ) 의 넣기회 로를 들수 있다. 이때 프로그람계수기 에 설정되는 값은 
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에만 출력 신호가 나오게 된 조합회 로의 한 종류이 다. 해 신기 는 보통 n 개의 입구와 2 n 
개 의 출구를 가지 고 있 다. 그림 1-15 에 는 3 입 구，8출구를 가진 해 신기 를 보여 주었 다. 

해 신기는 수자형콤퓨터 에서 많이 쓰인다. 한가지 실례 는 주소해 신이다. 256 父 8 bit 
RAM 소자 4 개를 씨서 1 Kbyte 의 기억기를 구성한다고 하자. 이때 다음과 같이 분할되 
는 유일 적 인 하나의 주소공간을 형 성하려 고 한다. 


A 

B 

C 


주소 _ 소편 

0000 - 00FF 0~~ 

0100 - 01FF 1 

0200 - 02FF 2 



그림 1-15. 3 입구 2 3 =8 출구해신기 

매 개 소자는 8 개의 주소선을 요구하며 이것들은 낮은 자리 8 bit 주소에 의하여 신호 
가 공급된다. lObit 주소가운데서 높은자리 2 bit 는 4 개의 RAM 소자가운데서 하나를 선 
택하는데 리 용된 다. 이 목적 을 위하여 2-4 해 신기 는 그림 1-16 에 서 보여 준바와 같이 4 
개의 소자중 어느 하나의 출구를 가능하게 하는데 리용된다. 
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I 기로 쓸수 있다. 분배기는 다중통로기 
I - 여러개의 출구가운데서 하나에 이어 
먼저 2 n 개의 첫 출력신호가운데서 하나 
n 개의 모든 출력신호선들은 자료입력신 
호선을 선택 하기 위하여 주소로서 n 개 
(0 또는 1) 이 출력 신호선에 이 어 진다. 

I 볼수 있다. 자료입력으로부터 가능에 
은 해 신기 의 시 간일치 조종을 가능하게 
이 1의 값을 가질 때에만 나타난다. 


해신입구가 있고 가능선 
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집적도의 수준의 높아 지면서 한 소편우에 보다 많은 문회로를 배치할수 있게 되였 
을뿐아니라 그 소편에서 문희로의 호상 련결을 잘 할수 있게 되였다. 이것은 가격저하， 
크기감소 및 동작속도증가(보통 소편내에서의 지연이 소편밖에서의 지연보다 더 짧으므 
로) 등의 우점을 가져 온다. 그러나 설계에서 문제가 생긴다. 매개의 특수한 론리함수 
또는 함수의 묶음에 대하여 소편우에서의 문회로의 배치와 호상련결을 설계하여야 한다. 
이러한 전용소자설계에 동반되게 비용과 시간이 많이 든다. 그리하여 특수목적에 실지로 
적응할수 있는 일반목적소편을 개발하는것이 관심사로 되였다. 그 관심을 모으고 있는것 
이 프로그람식론러배렬 (PLA:Programmable Logic Array) 소자이다. 

PLA 는 이미 본 임의의 불함수(진리값표)를 적의 합 (SOP) 형식으로 표현할수 있다 
는 사실 에 기 초하고 있 다. PLA 는 한 소편우에 있는 NOT, AND 및 OR 문회 로의 규칙 
적인 배렬로 이루어 진다. 매개 소편입구는 매개 입구와 그의 부정을 매 AND 문회로에 
가해 지도록 NOT 문회로를 통하여 지 나가게 되 여 있다. 매 AND 문희 로의 출구는 매개 
OR 문회로에 가해 지며 다시 매개 OR 문회로의 출구는 소자의 출구로 된다. 적당히 련 
결하면 임의의 SOP 식을 실현할수 있다. 

그림 1-19 자에는 3개 입구와 8개의 문회로 및 두개의 출구를 가진 PLA 를 보여 주 
었다. 대부분의 대규모 PLA 는 수백개의 문회 로와 15~25 개의 입구 및 5~15 개의 출구를 
가지 고 있다. 입구로부터 AND 문희 로에 로의 련결 , AND 문회 로로부터 OR 문회 로의 련 
결은 규정되여 있지 않다. 

PLA 는 프로그람작성 (련결의 작성)을 쉽게 하도록 두가지 서로 다른 방법 으로 만 
든다. 첫번째 방법에서는 가능한 모든 련결을 그 련결점에 휴즈를 집어 넣어 만든다. 불 
필요한 련결은 휴즈를 끊어 버 리여 제거 할수 있다. 이런 종류의 PLA 를 사용자 PLA 라 
고 한다. 한편 두번째 방법에서는 알맞는 호상련결패턴으로 공급되는 적당한 마스크를 
리용하여 소편제 조과정 에 정 확한 련결 이 이 루어 진 다. 이 두 경 우에 PLA 는 융통성 이 
있고 값 눅은 수자론리함수를 실현할수 있게 한다. 

그림 1-19 l 에는 두 불식을 실현하는 설계를 보여 주었다. 

5. 읽기전용기억기 

조합회로는 그의 출력이 오직 현재의 입력신호에 따라서 결정되며 이전 입력신호들 
의 경력에는 무관계하므로 흔히《무기억》회로로 간주한다. 그러나 조합회로로 실현되는 
한가지 부류의 기 억 기 인 읽 기 전용기 억 기 (ROM) 가 있 다. 

ROM 이 읽기동작만을 수행 하는 기 억기 라는것을 상기 해 보자. 이것은 ROM 에 기 억 
된 2 진정 보가 제 조공정 기 간에 작성 되 여 영 구적 이 라는것 을 의 미한다. 따라서 ROM 에 가 
해 진 입 력신호(주소선)는 늘 갈은 출력 신호(자료선)를 만든다. 출력 이 현재 가해 지 는 
입 력 신호의 함수로 되 기 때 문에 ROM 은 사실상 조합회 로이 다. 

ROM 은 해신기와 OR 문회로의 묶음으로 실현할수 있다. 실례로 표 1-8 을 보기로 
하자. 이것은 4 개의 입구와 4 개의 출구를 가진 진리값표로 볼수 있다. 가능한 16 개의 
매 개 입구변수에 대 응하는 묶음의 출력값들을 표에 보여 주고 있다. 이것 은 역 시 각각 
4bit 인 16 단어 로 된 64bitROM 의 내용을 정의 한것 으로 볼수 있다. 여 기서 4 개의 입 구 
는 주소를 지정하며 4 개의 출구는 그 주소에 의해 지정된 위치의 내용을 지정한다. 그 
림 1-20 에는 이 기억기를 4-16 해신기와 4개의 OR 문회로를 사용하여 어떻게 실현하는가 
를 보여 주었 다. PLA 와 갈은 규칙 적 인 구성 을 리용하여 호상련결 을 요구하는 결과를 
반영하도록 실 현 한다. 
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7. 가산기 


지 금까지 는 호상 련결된 문회 로들이 신호의 경 로조종，해 신 ， ROM 과 같은 기 능을 
실현하는데 어떻게 쓰이는가를 보았다 . 아직까지 보지 못한 하나의 기본령역은 산수연산 
이다. 여기서는 더하기기능에 대하여 간단히 개괄한다. 

2진수더하기는 불대수와 다르며 여기서는 결과에 자리올림항이 포함된다. 



그러 나 더 하기 를 불항과 관계 시 킬수 있다. 표 1-9 가 에 는 lbit 의 합과 자리 올림 비 트 
를 만들기 위하여 두개 의 입 구비 트를 더하는 론리 를 보여 주었 다. 이 진 리 값표는 수자론 
리 로 쉽 게 실 현된 다. 그러 나 꼭 한쌍의 비 트에 대 한 더 하기 를 수행하는데 는 흥미 가 없 다. 
요구되는것은 두개의 n-bit 수에 대한 더하기 이다. 이 문제는 한 가산기로부터의 자리올 
림을 다음가산기에 입력으로 제공하는 식으로 가산기의 묶음을 만들면 풀수 있다. 그림 
1-21 에 는 4 bit 가산기 를 보여 주었 다. 


표 1-9. 2진더하기의 진리값표 



L) 자리올림을 고려한 더하기 


C ln 

A 

B 

합 

c out 

0 

0 

0 

0 

0 

0 

0 

1 

1 

0 

0 

1 

0 

1 

0 

0 

1 

1 

0 

1 

1 

0 

0 

1 

0 

1 

1 

1 

0 

1 

1 

1 

0 

1 

0 

0 

1 

1 

1 

1 


여 러 비트가산기가 동작하도록 하자면 매 단일비트가산기가 아래자리로부터의 자리 
올림 까지 포함하여 3 개의 입 구를 가져 야 한다. 수정 된 진리값을 표 A -9 l 에 주었 다. 
두개의 출력은 다음식으로 표시된다. 

Sum = ABC + ABC + ABC + ABC 
Carry = AB + AC + BC 

그림 1-22 에 는 AND , OR 및 NOT 문회 로를 쓴 가산기 의 실현을 보여 주었 다. 

결 국 그림 1-23 에 보여 준것 과 같은 다중비 트가산기 를 실현하기 위한 필요한 론리 
회로를 가지게 된다. 매개 가산기로부터의 출력은 앞단가산기로부터의 자리올림에 관계 
되므로 맨 아래자리부터 맨 웃자리까지의 지연은 늘어 난다. 
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선행자리올림값에 대한 고려가 없이 임의의 단의 가산기에 대한 자리올림입구를 지 
정하는 식을 생각하면 그것은 다음과 같다. 

C 0 = A 0 B 0 (1-4) 

C t = AjBj + + BjA 0 B 0 (1-5) 

같은 절차로 따져 보면 다음식을 엄는다. 

C 2 = A^2®2 + A2A]B j + A.2AjAqBq +A.2BjAqBq + B^AjBj + BtAjAqBq + B2B^AqBq 

이 과정 을 임의 의 긴 가산기 에 대 하여서도 적 용할수 있다. 매 개 자리올림항은 자리 
올림 에 무관계하게 본래의 입력 에만 관계되는 함수로서 SOP 형식으로 표시할수 있다. 
따라서 가산기의 길이에는 관계 없이 두단 문회로의 지연만이 생긴다. 

긴 수들에 대해서는 이 수법 이 지 나치게 복잡해 진다. Nbit 가산기의 맨 웃자리 비트에 
대한 식을 평가해 보면 n -1 개 입구를 가진 하나의 OR 문회로와 2~ n+l 개의 입구를 가진 n 
개의 AND 문회로가 요구된다. 여기서 완전한 자리올림미리보기는 단번에 4~8 bit 만을 진 
행하는것 이 일반적 이 다. 그림 1-23 에는 4개의 8 bit 가산기로 32 bit 가산기를 어떻게 구성하 
는가를 보여 주었다. 이런 경우에 자리올림은 4 개의 8 bit 가산기를 거쳐 차례로 전달되여 
야 하지만 32 개의 lbit 가산기를 차례 로 거 치는것보다는 실질적 으로 빨라 진다. 

제 4 절. 순서회로 

조합회로는 수자형콤퓨터의 기본적인 기능을 실현한다. 그러나 조합회로는 ROM 의 
경우를 제외하고는 수자형를퓨터의 연산에서 기본적 인 요소인 정보의 기 억 또는 보관을 
하지 못한다. 이를 위하여 보다 복잡한 형태의 수자론리회로인 순서회로가 쓰인다. 순서 
회 로의 현재 출력 은 현재입 력 에 만 관계 되 는것 이 아니 라 입 력 신호의 지 나간 결과에 도 관계 
된다. 이것을 좀 다르게 그리고 보다 일반적인 쓸모 있는 방법으로 고찰하면 순서회로의 
출력은 현재입 력과 회 로의 현재상태 에 관계된다고 할수 있다. 

이 절에서는 몇가지 간단하면서도 쓸모 있는 순서회로의 실례에 대해서 보게 된다. 
순서회 로는 조합회 로를 씨서 만든다. 

1. 방아쇠회로 

가장 간단한 형 태의 순서회 로는 방아쇠회 로이다. 방아쇠회 로에는 두가지 특성을 공 
유하는 여 러가지 종류가 있 다. 

• 방아쇠 는 쌍안정 회 로이 다. 두 상태 가운데 서 한 상태 에 존재하며 입 력신호가 없으 
면 그 상태에 남아 있게 된다. 따라서 방아쇠는 lbit 기억기로 동작할수 있다. 

• 호아쇠 는 서 로가 부정관계 에 있는 두 출구를 가진다. 이 두 출구는 보통 Q 및 
今로 표기된다. 

S-R 빗장 

그림 1-24 에는 S-R 방아쇠 또는 S-R 빗 장으로 알려 진 공통적 인 구성을 보여 주었 
다. 이 회로는 두개의 입구 S (설정)와 R (재설정)，두개의 출구 Q 와 Q 그리고 귀환결 
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합을 엇걸어 놓은 NOR 문회로로 구성되여 있다. 

우선 이 회로가 쌍안정회로라는것을 보기로 하자. S 와 R 가 둘다 0 이고 Q 가 0 이 
라고 하자. 그러면 아래쪽 NOR 문회로의 입구는 Q =0 이고 S =0 이 다. 따라서 출구 
Q =1 은 웃쪽 NOR 문희 로의 입구가 Q =1 및 R =0 으로 된다는것을 의미 하며 출구는 Q =0 
이 된다. 결국 회로의 상태는 내부적으로 변하지 않으며 S = R =0 인 동안은 오래동안 안정 
상태에 남아 있게 된다. 갈은 리유로 역시 Q = l , Q =0 인 상태도 R = S =0 에 대하여 안정 
상태이다. 



이 렇게 이 회 로는 lbit 기 억기 로 동작한다. 출구 Q 는 비트의《값》으로 볼수 있다. 
입구 3_와 R 는 기억기에 각각 1 및 0 값을 쓰기 하는데 리용한다. 이것을 보기 위하여 
Q =0, Q =1, S =0, R =0 인 상태를 보자. 이제 S 가 값 1 로 변한다고 가정하자. 이때 아래 
쪽 NOR 에 대 한 입 구는 S = l , Q =0 이 다. 약간한 시 간지 연 t 후에 아래 쪽 NOR 문희 로 
의 출구는 Q =0 으로 된다(그림 1-25 를 참고). 따라서 이 순간에 웃쪽 NOR 문회로에 
가해 지는 입구는 R =0， Q =0 으로 된다. a t 의 다른 문희로지연이 지나면 Q 는 1 로 
된다. 이것은 다른 하나의 안정상태이 다. 이때 아래쪽 문회 로의 입구는 S = l , Q =1 이 
고 줄구 Q =0 을 유지하게 한다. 

R 입구는 j 반대의 기능을 수행한다. 묘 가 1이 될 때 Q 와 Q 의 이전상태에는 관 
계없이 Q =0, G =1 로 된다. 다시 2 At 의 시간지연이 일어 나고 이전의 안정상태가 다 
시 설정된다(그림 1-25). 

S-R 빗 장은 특성 표라고 하는 진리 값표와 비 슷한 표에 의하여 정 의할수 있 다. 표는 
현재상태와 입력의 함수로서 순서회로의 상태와 다음상태를 보여 준다. S-R 빗장인 경 
우에 그 상태는 Q 의 값에 의하여 정의될수 있다. 표 1-10 자는 특성표를 엄는 과정을 
보여 주고 있다. 표에서 입구 S = l , R =1 에 대해서는 허용하지 않는다. 그것은 이런 조 
합은 모순되는 출력 ( Q 와 Q 가 둘다 0 과 갈은)을 만들기때문이 다. 이 표는 표 1-10 
L 와 같이 더 간단히 표시 될수 있다 . S-R 빗 장의 동작과정 의 해 설은 표 1-10 도 에서 보 
여 주었다. 
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동기식 S-R 방아쇠 

S-R 빗 장의 출구는 입구에서의 변화에 응답하여 짧은 지 연시 간후에 변한다. 이것은 


표 1-10. 

1) 특성표 

S-R 빗 장 


현재 입구 

현재상태 

다음상래 

SR 

Qn 

Qn+ 1 

00 

0 

0 

00 

1 

1 

01 

0 

0 

01 

10 

10 

11 

11 

1 

0 

1 

0 

1 

0 

1 

1 


1_) 간단화된 특성표 

S 

R Qn+ 1 

0 

0 Qn 

1 

1 

0 1 

1 _ 


c) 입구직렬에 대한 응답 


t 

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

s 

1 

0 

0 

0 

0 

0 

0 

0 

1 

0 

R 

0 

0 

0 

1 

0 

0 

1 

0 

0 

0 

Qn + 1 

1 

1 

1 

0 

0 

0 

0 

0 

1 

1 



비동기동작으로 고찰된다. 수자형 콤퓨터 에 서 가장 특징 적 인 점 은 박자임풀스가 발생할 
때에만 변화가 일어 나도록 사건들이 박자임풀스에 동기되여 있는것이다. 그림 1-26 에는 
이 러한 구성을 보여 주었다. 이 회로는 동기식 S-R 방아쇠로 고찰된다. R 및 S 입력신호 
는 박자임 풀스가 가해 지 는 기 간에 만 NOR 문회 로를 통과한다. 

D 방아쇠 

S-R 방아쇠에서 제기되는 한가지 문제는 R = l , S =1 인 조건을 피해 야 한다는것 이 다. 
이 를 위한 한가지 방도는 꼭 한개 의 입 구만 가지 게 하는것 이 다. D 방아쇠 는 이 문제 를 
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완전히 풀어 준다. 그림 1-27 에는 D 방아쇠의 문회로에 의한 실현과 특성표를 보여 주었다. 
반전기를 써서 박자신호입구가 아닌 두 AND 문회로에로의 입구가 서로 정반대가 되도 
록 한다. 

D 방아쇠는 때때 로 lbit 자료에 대 한 효과적 인 보관을 진행하므로 자료방아쇠 라고도 
한다. D 방아쇠의 출력은 언제나 입력에 가해 진 마지막값과 같게 된다. D 방아쇠는 또한 
한 박자임풀스인 동안 그의 입구에 가해 진 0 또는 1 을 지연시키므로 지연방아쇠 라고도 
한다. 



그림 1-27. D 방아쇠 


J-K 방아쇠 

또하나의 쓸모 있는 방아쇠는 J-K 방아쇠 이다. 이것은 S-R 방아쇠와 같이 두개의 입 
구를 가지고 있다. 그러나 이 회로에서는 있을수 있는 모든 조합의 입력값이 다 허용된 
다. 그림 1-28 에 는 J-K 방아쇠 의 문회 로에 의한 실현을 보여 주었 다. 그림 1-29 에 는 특 
성 표를 보여 주었 다 (S-R 및 D 방아쇠의 특성 표와 함께 ). 첫 3 가지 조합은 S-R 방아쇠 에 
대 한것과 갈다. 입구가 없을 때도 안정하다. J 입구는 혼자서 출구를 1 로 만드는 설정기 
능을 수행하며 K 입 구는 혼자서 출구가 0 이 되 게 하는 지 우기 기 능을 수행한다. 



J 와 K 의 두 입구가 1 일 때는 뒤집 기기 능이 라고 하는 기능을 수행 한다. 이때 출구 
는 반전한다. 그리하여 만일 Q 가 1 이고 J 와 K 에 1 이 가해 지면 Q 는 0이 된다. 독자 
들이 그림 1-28 의 실현이 이 특성 기 능을 산생하는가를 검 토해 보기 바란다. 

2. 등록기 

방아쇠의 한가지 응용실례 로서 먼저 CPU 의 기 본요소의 하나인 등록기 에 대 하여 보 
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기는 한 방아쇠의 출구가 다음방아쇠의 동작상태변화를 시동시키므로 상대적으로 속도가 
뜨다. 동기식계수기에서는 모든 방아쇠가 같은 시각에 상태를 바꾼다. 동기식계수기는 
속도가 훨 씬 빠르므로 CPU 에 서 많이 쓰이 는 종류이 다. 그러 나 비 동기식계 수기 는 서 술 
로부터 론의를 시작하는것 이 쓸모 있다. 

비동기식계수기 

비동기식계수기에서는 계수기를 하나 증가시키기 위해 일어 나는 변화가 한끝에서 
시 작하여 다른 끝까지 전달되 므로 직 렬계수기 라고도 한다. 그림 1-32 에 는 J-K 방아쇠를 
리용한 4 bit 계수기의 실현과 그의 동작과정을 보여 주는 시간선도를 함께 주었다. 시간 
선도는 신호가 방아쇠렬을 따라 가면서 움직 일 때 생기는 전달지연을 보여 주지 않도록 
리상화되 였 다. 가장 왼쪽에 있는 방아쇠의 출구 ( QO ) 는 맨 아래 자리 비 트이다. 이 설계는 
더 많은 방아쇠를 종속련결함으로써 얼마든지 긴 비트수를 가진 계수기로 확장할수 있다 
는것이 명백하다. 

우의 실현에서 계수기는 매개 박자임풀스가 올 때마다 하나씩 증가된다. 매 방아쇠 
의 그 와 K 입구에는 늘 1 이 설정된다. 이것은 박자임 풀스가 올 때마다 Q 의 출구는 반전 
된다는것을 의미한다. 상태변화는 박자임풀스의 내림면에서 일어 나도록 보여 주고 있다. 
이 런 방아쇠 를 모서 리 시 동방아쇠 라고 한다. 임 풀스자체 가 아니 라 박자임 풀스에 서 의 상태 
이행에 따라 동작하는 방아쇠를 리용하면 복잡한 회로에서의 시간조종을 더 잘 할수 있 
다. 이 계수기 에 대 한 출구패 런을 조사하면 0000, 0001, …，1110, 1111，0000과 같이 순 
환한다는것을 알수 있다. 



-1)' 

박자 —rmjirLnjT/mjTnnnrLrLnTL 


效 


Q4 


그림 1-32. 맥 동계 수기 : -I -순서 회 로 ， l - 시 간선도 


동기식계수기 

i 동3수기는 값이 변화될 때 지연이 동반되는 부족점을 가지고 있으며 이것은 계 
수기의 길이 에 비례한다. 이 런 부족점을 극복하기 위하여 CPU 는 동시에 계수기의 모든 
방아쇠 들의 상태 가 변 하게 되 는 동기 식 계 수기 를 리 용한다. 여 기 서 는 3 bit 동기 식 계 수기 에 
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는 순서대로 목록화되 여 있다. 매개 행 에는 A, B，C 의 현재값과 A, B, C 의 다음값을 
엄 는데 요구되 는 3개의 방아쇠 에 대 한 입 구들을 기 입한다. 

그림 1-33 자의 진리값표가 작성되는 방법을 리해 하기 위하여 J-K 방아쇠 에 대한 특 
성 표를 고쳐 만드는것 이 방조가 될수 있 다. 그 표를 다시 상기하면 다음과 같다. 


J 

K 

Q n+l 

0 

0 

Qn 

0 

1 

0 

1 

1 

0 

1 

1 

Q n+l 


이 형식에서 표는 J 및 K 입구가 출구에 대하여 가지는 효과를 보여 준다. 이제 같 
은 정보에 대하여 다음과 같은 구조를 생각해 보자. 

Qn J K Q „ +1 

0 0 do 

0 1 d 1 

Id 10 

Id 0 1 

이 형 식 에서는 표가 입구와 현재의 출구가 알려 지면 다음출력값을 제 공해 준다. 이 
것은 정확히 말하여 계수기 또는 임의의 순서회로의 설계에서 요구되는 정보이다. 이런 
형 식의 표를 려기 표라고 한다. 

그림 1-33 자로 되돌아 가서 첫행을 보자. 박자임풀스가 가해 지면 A 값이 0 이고 B 
값도 0상태 에 있어 C 값이 0부터 1 로 변한다. 려 기 표는 0의 출력 상태 를 유지 하자면 입 
구가 J=0 이고 K 에 대해서는 무이금지조건이 되여야 한다는것을 보여 준다. 0 부터 1 에 
로의 이행이 일어 나자면 입구가 J=1 및 K=1 로 되여야 한다. 바로 이 값들을 표의 첫 
행에서 보여 주었다. 비슷한 리유로부터 표의 나머지부분들도 채울수 있다. 

그림 1-33 자 의 진리 값표를 구성하면 A, B 및 C 의 현재 값의 함수로서 모든 J 및 K 
입 구들의 요구되는 값을 제시하는 표를 보게 된다. 그러면 칸도표의 도움으로 이 6 개의 
함수에 대한 불식을 얻어 낼수 있다. 이에 대해서는 갈은 그림의 i •부분에서 보여 준다. 
가령 J 변수에 대한 칸도표 (A 출구를 만드는 방아쇠에 대한 J 입구)는 식 J a =BC 라는 결과 
를 준다. 6개의 식 이 유도되 면 그것은 곧바로 그림의 n 부분에 보여 준것과 같은 실제회 
토를 설 계하는 자료로 된 다. 

련습문제 

1. 다음불식에 대한 진리값표를 작성하시오. 

ᄀ . ABC + ABC l. ABC + ABC + ABC 

n. A(B ᄅ + 豆 C) h. (A + B)(A + C)(S + 豆 ) 
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2. 다음론리식을 교환법칙에 따라 간단화하시오. 

1. A •豆 + 豆 •A + OD*E + ᄅ •£)•£ + £ •ᄅ 
l. A«B +A*C + B«A 
n . (L«M«N)(A«B)(C«D«E)(M«N»L) 

3. 다음방정식에 데모르간의 정리를 적용해 보시오. 

ᄀ. F = V + A + L 
l. F = S + 豆 + ᄅ +D 

4. 다음론리식을 간단화하시오. 

ᄀ. A = S*T + V«W + R*S*T 
l. A = T*U«V»W + X«Y + Y 
n. A = F«(E + F + G) 

ᄅ. A = (P^Q + R + S«T)T«S 

n. A = D«D«E _ 

H. A = Y«(W + X + Y + Z)«Z 
A. A = (B«E + C + F)«C 

5. 기 본불연산인 AND , OR 및 NOR 로부터 XOR 연산을 구성 하시 오. 

6. 3 입구 AND 기능을 수행할수 있는 론리도를 NOR 문회로와 NOT 문회로로 그리시오. 

7. 4 입구 NAND 문회 로에 대 한 불식을 쓰시오. 

8. 그림 1-34 에 보여 준것 처 럼 10 진수자의 7 조각표시 기 를 조종하는데 쓰이 는 조합 
회로가 있다. 회로에는 4 개의 입구가 있다. 이 입구들은 조임형 10 진수표시에 
쓰이는 4 bit 부호를 제공한다 ( D 10 =0000, …，9 10 =1001) . 7 개의 출구는 주어 진 10 
진수자를 표시 하기 위하여 능동으로 되 는 조각들을 규정한다. 일부 입 구와 출구 
조합은 필요 없다. 


Zi 




- Zi 


Di - 

조합 회로 

— -Z ： 22 

z 4 

D3 

- z 4 


d 4 


- z 5 




z 6 Z 5 

z 7 



1 ) z 7 


Dk'dHEibTM 


그 림 1-34. 7쪼각 LED 표시실 례 
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n . 이 회로에 대한 진리값표를 만드시오. 
l . SOP 형식의 진리값표를 표시하시오. 
n . POS 형 식의 진리 값표를 표시하시 오. 

9. 8-1 다중통로기 를 설 계하시 오. 

10. 그림 1-15 가 분배 기 로 동작하도록 보충적 인 신호선을 첨 가하시 오. 

11. 그레이부호는 옹근수에 대한 2진수부호이다. 이 부호는 원래의 2진수표시와 
차이난다. 이 부호에서는 련이 어 있는 임의의 두수의 표시 에서 lbit 만 차이 
나게 되여 있다. 이 부호는 순차적 인 수가 발생되는 계수기나 상사-수자변환 
기와 같은 응용분야에 쓸모가 있다. 다만 한순간에 lbit 만이 바뀌기때문에 
약간한 시 간차에 의한 어떠 한 모호성 이 절대 로 없다. 이 부호의 첫 8 개 요 
소는 다음과 같다. 


2 진코드 

그레 이 코드 

000 

000 

001 

001 

010 

011 

011 

010 

100 

110 

101 

111 

110 

101 

111 

100 


2진그레이부호변환회 로를 설계 하시 오. 

12. 4 개 의 3 X 8 해 신기 (허 가입 구가 있는)와 2 X 4 해 신기 를 써 서 5-32 해 신기 를 설 

계 하시 오 . 

13. 그림 1-22 의 옹근수가산기를 곡 5 개의 문회 로로 구성하시오 (암시 : 몇개의 문회 

토는 XOR 이 다. ). 

14. 그림 1-22 를 고찰해 보자. 매 개 문회 로가 10 ns 의 시 간지연을 만들어 낸 다고 하 

자. 이 때 합출구는 30 ns 후에 그리 고 자리 올림 출구는 0 ns 후에 안정된다. 
32 bit 가산기인 경 우 총적 인 가산시 간은 얼마인가. 

1. 그림 1-21 에서와 같이 자리올림미리보기기능이 없이 실현하시오. 
l . 그림 1-23 에 서 와 같이 자리 올림 미 리 보기 기 능과 8 bit 가산기 를 리 용 
하여 실현하시오. 
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부특 II . 콤퓨터조직과 구성방식을 가르치기 
위한 과제 

많은 교원들은 연구 및 개발 과제가 콤퓨터조직과 구성방식의 개념을 명백히 리해하 
는데서 중요한 자리를 차지한다고 보고 있다. 이 지도계획이 없이는 학생들이 일부 기본 
개념과 구성요소들의 호상관계를 파악하기가 어려울수 있다. 이 지도계획의 목적은 이 
책에서 언급된 개념을 보충하고 학생들에게 처리장치의 내부동작에 대한 보다 명백한 인 
식을 주며 학생들을 계발시키고 그들에게 학습내용을 완전히 파악시키자는데 있다. 

이 책 에서는 개념들을 될수록 명백히 리해시키고 공고화하기 위하여 200 개정도의 
복습문제를 제시하였다. 많은 교원들은 계획에 이 교재를 보충하려고 한다. 이 부록에서 
는 몇개의 안내 를 제공하고 있는데 여 기 에는 교원들을 위 한 지 도서 에 쓰는 보충자료들을 
서 술하였 다. 보충자료에 는 3 가지 종류의 지 도계 획 을 반영 하고 있 다. 

• 연구개발지도계획 

• 모의 개 발지 도계 획 

• 참고문헌 학습과제 제 시 


1. 연구개발지도계획 

강의 에서 배운 기본개념들을 더잘 리해시키고 학생들의 연구능력을 키워 주는 
효과적인 방도는 연구계획를 맡겨주는것이다. 이런 계획에는 판매제품의 Web 탐색을 
비 롯한 문헌탐색，연구실 험활동 및 표준화 등이 포함될수 있 다. 개 발계 획 은 개발림 
이든가 계획이 작은 경우에는 개별적으로 줄수도 있다. 어떤 경우에는 주어야 할 계 
획의 제목과 수준이 적당한가를 평가하는것과 함께 학기시작전에 몇가지 계획에 대 
한 의 견을 학생 에 게서 받는것 이 가장 좋다. 연구계 획 을 위해 학생 에 게 줄 문건에 는 
다음과 갈은것 이 포함된다. 

• 신청 양식 

• 최종보고양식 

• 중간 및 최 종제 출날자가 있는 일정계획 

• 가능한 계획목록 

학생은 과제목록가운데서 하나를 선택하거나 자기에게 알맞는 계획을 제기할수 있다. 
교원의 지 도서 에는 있을수 있는 연구제 목목록뿐아니 라 제 안된 신청 양식 과 최 종보고양식 
도 포함되 여 있어 야 한다. 
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2. 모의지도계획 

처 리 장치 의 내 부조작에 대 한 파악을 가지 며 일부 설계 해결책과 성 능관계 를 연구하고 
평가하기 위한 우수한 방도는 처리장치의 기본요소들을 모의하는것이다. 이를 위하여 리 
용하고 있는 도구는 Simple Scalar 이 다. 

실제적인 장치실현과 비교해 볼 때 모의는 연구사업과 교육사업을 할때의 두가지 
몇가지 우점이 있다. 

• 모의 를 하면 각이한 구성 요소들의 변경 과 그들의 성 능특성 의 변화，그리 고 
그에 따르는 효과분석 이 쉽다. 

• 모의 를 하면 또한 구체 적 인 성능에 대 한 통계 적 자료를 얻을수 있으며 성 능해 
결 책에 대한 문제 점 들을 리 해 하기 쉽 다. 

SimpleScalar [ BURG 97] 은 현대 적 인 처 리 장치 와 체 계 의 어 떤 계 렬 에 대 한 실제 프로 
그람을 모의하는데 쓰이는 도구들의 모임 이 다. 이 도구모임에는 번역프로그람, 기호번역 
프로그람，련결편집프로그람 및 모의 및 현시도구가 포함되 여 있다. SimpleScalar 는 매 
우 빠른 함수모의 로부터 구체 적 인 비순차명 령출구에 이 르기 까지 를 포괄하는 처 리 장치모 
의 와 비 블로크화캐 쉬 와 투기 실 행 을 지 원하는 슈퍼 스칼라처 리 장치 모의 를 제 공한다. 명 령 
모임 구성 방식과 구조적 파라메터는 여 러 가지 실험 에 따라서 변경할수 있다. 이 책 에 대 한 
교원의 지도서에는 학생들이 SimpleScalar 를 어떻게 설치하고 기동시키는가에 대한 명 
령을 비롯한 일련의 명령들이 간결하게 서술되여 있다. 지도서에는 또한 일부 제안된 연 
구계획할당안이 들어 있다. 

SimpleScalar 는 Windows NT 와 대부분의 UNIX 기 반에서 실행될수 있는 휴대 용 
프로그람제 품이 다. SimpleScalar 프로그람은 SimpleScalar Web 싸이 트로부터 호출하여 
설 치할수도 있 다. 그것 은 비 상업 적 용도에 는 무료로 쓸수 있 다. 


3. 참고문헌학습과제 

강의에서 나오는 개념을 보충하고 학생들에게 연구경험을 가지도록 하기 위한 또 한 
가지 좋은 방법은 읽고 분석한 참고문헌으로부터의 론문과제를 할당하는것이다. 교원지 
도서에는 우에 서술된 장마다 하나 혹은 두개의 론문제목들을 제시하였다. 론문은 인터 
네트나 대학도서관을 통하여 제공 받을수 있다. 지도서에는 또한 연구과제 에 필요한 용 
어가 제시되였다. 
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용어해설 


가상기억기 Virtual Storage 

가상주소를 실 지 주소로 배 치하는 를퓨 
터 체 계의 사용자에 의하여 주소지정 가 
능주기 억 기처럼 볼수 있는 기억 기 공간. 
가상기 억기의 크기는 주기억기위치의 
실제 적 인 수에 의 해 서 가 아니 라 콤퓨터 
체계의 주소지정방식과 리용할수 있는 
보조기억기의 크기 에 의 하여 제 한된다. 
간접주기 Indirect Cycle 

CPU 가 간접 주소를 직 접 주소로 변환하 
기 위하여 기억기접근을 진행하는 명령 
주기의 한 부분 
간접주소 Indirect Address 

주소를 가지는 기 억기위치의 주소 
고리형사슬 Daisy Chain 

새치기자원들을 순서대로 련결하여 새 
치 기 우선권을 결정 하기 위한 장치 들의 
호상련결방법 

고밀도디스크 Compact Disk ( CD ) 

수자화된 음성정보를 기 억하는 지울수 
없는 디스크 

고점수표현체계 Fixed-Point Representation 
System 

소수점이 합의된 일부 협약대로 배치된 
수자렬에서 암시적으로 고정되는 소수 
점수체계 

고 체 상 태 구 성 요 소 Solid-State 
Component 

조작이 고체에서의 전기적 혹은 자기적 
현상의 조종에 의존하는 구성요소 ( e . g . 
반도체 3 극소자，2 극소자，페 리 트자심 ) 
국부변수 Local Variable 

프로그람의 어느 규정된 한 부분에서만 
정의되고 리용되는 변수 
극소형콤퓨터 Microcomputer 


처 리장치 가 극소형처 리소자로 된 콤퓨 
터체 계 . 극소형콤퓨터 는 극소형처 리소 
자，기 억기， I/O 장치 로 되 여 있으며 이 
것들은 한개의 소편우에 있을수도 있고 
그렇지 않을수도 있다. 

극소형처리장치 Microprocessor 

요소들이 한개 혹은 몇개의 집적회로로 
극소화된 처 리 소자 
금지된 새치기 Disabled Interrupt 
CPU 를 조작하여 규정된 준위의 새 치 
기 요구를 무시 하는 조건 또는 상태 
기억 기주소등록기 Memory Address 
Register ( MAR ) 

처 리장치에서 접근되는 기억주소를 가 
지는 등록기 

기 억기완 충등록기 Memory Buffer 
Register ( MBR ) 

기억기로부터 자료를 읽거나 기억기에 
자료쓰기를 진행하는 등록기 
기억기주기시간 Memory Cycle Time 
기억기접근속도의 역수. 하나의 접근요 
구(읽기 혹은 쓰기)에 대한 응답과 다 
음접근요구에 대한 응답사이 최소시간 
이다. 

기억주소식 I/O ( Memory-Mapped I / O ) 
I/O 모둘과 외부장치 를 기 억주소를 리 
용하여 지 정하는 방법 . 하나의 주소공 
간이 주기억 기 와 I/O 주소지 정 에 다같 
이 리 용되 며 기 억 기 와 I/O 읽 기 /쓰기 에 
같은 기계명령들이 리용된다. 

기우성비트 Parity Bit 

모든 수자들의 합이 늘 기수(기수성) 
혹은 늘 우수(우수성)가 되도록 2 진수 
자들의 모임에 첨부되는 비트 
기준주소 Base Address 

콤퓨터프로그람의 집행에서 주소를 계 
산할 때 참조하는 수값 
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긴 명 령 단 어 Very Long Instruction 
Word 

다중조작을 포함하는 명령들의 리용을 
말한다. 실지 로 다중명 령 들은 단일한 
단어 에 포함된다. 대표적으로 VLIW 는 
를파일 러 에 의하여 구성 되 는데 를파일 
러는 같은 단어에 병렬로 실행될수 있 
는 조작을 배 치 한다. 

관흐름 Pipeline 

여러개의 명령을 동시에 실행할수 있도 
륵 여러개의 단들로 이루어 진 처리장 
치조직 

ᄃ 

다중틍로 Multiplexer Channel 

여 러 개의 입 출력장치들을 동시 에 조작 
하도록 설계된 통로. 여러개의 I/O 장 
치가 자료의 항목들을 교차조작하면서 
같은 시간에 레코드들을 전송할수 있다. 
바이 트다중선택통로，블로크다중선택통 
토를 참고하시오. 

다중처 51 장치 Multiprocessor 

주기억기를 공동으로 접근할수 있는 여 
러개의 처리장치들을 가진 콤퓨터 
다중프로그람 방식 Multiprogramming 
단일 처리 장치 에 의 해 둘 혹은 그이 상의 
콤퓨터프로그람의 집행을 교대로 진행 
하는 조작방식 
다중화장치 Multiplexer 

여 러개의 입 구를 단일출구에 련결하는 
조합회로. 임의의 시간에 오직 하나의 
입구만이 선택되여 출구로 나간다. 

단일처리과정 Uniproccessing 

처리장치들에서 명령들의 순차적인 처 
리과정 혹은 다중처리체계에서 처리장 
치들의 독립적인 리용 
단항연산자 Unary Operator 

1 과 한 연산수만의 연산을 표시하는 
연산자 

동적 RAM Dynamic RAM 

기억세포들이 축전기를 리용하여 실현 


된 자유기억기. 동적기억기는 주기적으 
로 재생하지 않으면 기 억된 자료를 인 
차 잃어 버릴수 있다. 

독립디스크들의 여분배렬 Redundant 
Array of Independent Disks 
( RAID ) 

물리 적 기 억 기용량의 한 부분을 나머 지 
부분에 기억된 사용자자료의 여유정보 
를 기억시키는데 리용하는 디스크배렬 
방식. 여유정보는 배렬의 성원디스크중 
의 하나 혹은 그에 대 한 접근경로가 고 
장인 사건에서 사용자자료의 재생을 가 
능하게 한다. 

등록기 Registers 

CPU 내부의 고속기 억기 . 일부 등록기 
들은 사용자가 쓸수 있다. 즉 기계명 령 
들을 통하여서만 프로그람작성자가 리 
용할수 있다. 기 타 등록기들은 조종목 
적을 위 하여 CPU 에 의 하여서 만 리 용 
된 다. 

동기 식 동기 화(동기 식 시 간일 치 ) 

Synchronous Timing 
모선에 대 한 사건 발생 이 박자에 의해 
결정되는 기술. 박자는 갈은 너비의 시 
간름을 가지며 사건들은 그 시간름의 
시작에서만 일어 난다. 

디스케트 Diskette 

보호함에 넣 어 진 유연성 자기디 스크. 
플로피디스크라고도 한다. 

디스크묶음 Disk Pack 

디 스크구동기 로부터 통채 로 교체할수 
있 게 한 자기디 스크의 조립 묶음. 이 것 
은 조작중에 조립묶음을 분리할수 있는 
함에 넣어 진다. 

디 스크자료쪼각분산 Disk Stripping 
론리적 으로 련속인 자료블로크 혹은 
조각들을 련속적인 배렬성원들에 대 
하여 회 전순서 로 배 치하는 디 스크배 
렬배치의 한 형태. 매 배렬성원들에 
정 확히 한 조각씩 배 치하는 론리 적 으 
로 련속인 조각들의 묶음을 줄무늬라 
고 한다. 
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대 칭 다 중 처 리 Symmetric Multi - 
proccessing ( SMP ) 

조작체계가 임의의 필요한 처리소자 혹 
-은 여러개의 차리소자들에서 동시에 처 
리할수 있는 다중처 리의 한 형태 

ᄅ 

련상기억기 Associative Memory 

기억위치가 그것들의 이름이나 주소에 
의해서가 아니라 그 내용 혹은 그 내용 
의 일부분에 의하여 지적되는 기억기 
류 점 수 표 현 체 계 Floating-Point 
Representation System 
실수가 한쌍의 서로 구별되는 두수에 
의 하여 표시 되 는 수체 계 . 실 수는 두수 
들중의 하나인 고점수부(곁수부)와 두 
번째 수를 가리키는 류점수표현에서의 
지 수라고 하는 제 곱에 대 한 암시 적 인 
류점 수밑 수에 의하여 얻 어 진 값 (지 수 
부)의 적이다. 

□ 

마이크로명령 Microinstruction 

기계명령보다 더 낮은 준위에서 처리장 
치안의 자료흐름과 처리순서를 조종하 
는 명령. 개별적인 기계명령들과 다른 
기능들은 마이 크로프로그람에 의해 수 
행된 다. 

마이크로조작 Micro-Operation 

한박자의 임 풀스내 에 수행 되 는 CPU 의 
개별적인 조작 

마이크로 프로 그람 Microprogram 

특별한 기억기안에 있는 마이크로명령 
의 렬로서 여러가지 기능을 수행하는데 
동적으로 접근될수 있다. 

미이 크로프로그림화된 CPU Microprogrammed 
CPU 

조종장치 를 마이 크로프로그람방식 을 리 
용하여 실현한 중앙처 리 장치 
마이 크로프로그람언 어 Microprogramming 
Language 


마이 크로프로그람을 서 술하기 위하여 
리용되는 명령모임 

명 령 주 소 등 록 기 Instruction Address 
Register 

실 행하려 는 다음명 령 의 주소를 보관하 
는데 리용되는 전용등록기 
명령주기 Instruction Cycle 

단일 명 령 실 행 을 위 해 CPU 에 의 하여 
수행 되는 처리 과정 
명령형식 Instruction Format 

비 트렬로 된 콤퓨터명 령의 지 면배 치 . 
명령형식은 명령의 구성요소에 따라서 
여러개 마당으로 나눈다(례하면 조작코 
드，연산수 등) 

명령등록기 Instruction Register 

해석을 위해 명령을 보존하는데 리용되 
는 등록기 
모선 Bus 

하나 또는 그 이상의 선들을 묶어서 구 
성한 공유전송경로. 일부 콤퓨터체계들 
에서 CPU , 기 억 기， I/O 등 구성 요소들 
은 공통모선에 련결된다. 모든 구성요 
소들이 모선을 공유하므로 임의의 순간 
에는 오직 하나의 장치만이 모선을 리 
용할수 있다. 

모선중재 Bus Arbitration 

경 쟁하는 모선관리 자중에 서 어 느것 이 
모선에 대한 접근권을 가지는가를 결정 
하는 처 리 공정 
모선관리기 Bus Master 

모선에 대한 초기화 및 통신을 조종할 
수 있는 모선에 련결된 장치 
모방 Emulation 

주로는 하드웨어에 의하여 어떤 체계의 
전체 혹은 일부를 모방하는것. 여기서 
모방하는 체계는 같은 자료를 받아서 
같은 프로그람을 실행 하여 모방되는 체 
계와 같은 결과를 얻는다. 

문회로 Gate 

입구신호들에 대한 간단한 불연산으로 
출구신호를 만드는 전기적회로 
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무조건이행 Unconditional Jump 

그것을 규정한 명령이 어느때나 실행되 
도륵 일어 나는 이행 
밀수 Base 

과학론문들에서 흔히 리용되는 수체계 
에서 표현되는 실수를 결정하기 위하여 
지수부로 표시되는 제곱을 발생시키며 
결수부에 곱해지는수(실례로 식 2.7 > 

6.25 15=42.1875 에 서 수 6.25). 

ᄇ 

바이트 Byte 

8개의 비트. Octet 라고도 한다. 

바 이 트 다 중 통 로 Byte Multiplexer 
Channel 

자료바이 트들을 교차조작하는 다중통로 . 
블로크다중통로를 참고하시 오. 선택기 
통로와 비교하시오. 

반도체 Semiconductor 

전기전도도가 부도체와 도체사이의 중 
간값을 가지는 규소나 게르마니움과 같 
은 고체결정물질. 3 극소자와 고체상태 
요소를 만드는데 리용한다. 

방아쇠 Flip-Flop 

주어 진 순간에 두개의 안정상태중 하나 
의 안정상태를 가질수 있는 능동요소회 
로 혹은 장치，쌍안정회로라고도 한다. 
보조기억기 Secondary Memory 

디스크와 레프를 비롯하여 콤퓨터체계 
밖에 위치한 기억기 

부 호 - 크 기 표 현 Sign-Magnitude 
Representation 

2 진옹근수를 표시 하기 위해 리용. 
N-bit 단어 에 서 맨 아래 자리 비 트는 부호 
(0= 정，1=부수)이 고 남은 N -1 개 의 비 
트들은 수의 크기 를 표시한다. 

분기예측 Branch Prediction 

프로그람을 실 행 하기 전에 분기결과를 
예 측하기 위하여 처 리 장치 에 서 리 용하 
는 기구 

분리된 입출력 Isolated I/O 


I 八)모둘과 외 부장치 들의 주소지 정 하는 
방법 . I/O 주소공간은 주기억 주소공간 
으로부터 개별적으로 취급된다. 특수한 
I/O 기 계 명 령 들을 리 용해 야 한다. 기 억 
기 배 치 식 I 八) 와 비 교하시 오. 

블 로 크 다 중 통 로 Block Multiplexer 
Channel 

자료블로크를 교차조작하는 다중통로 . 
바이 트다중 통로를 참고하시 오. 

백토르 Vector 

보통 순서화된 스칼라묶음에 의 하여 특 
징 지어 지는 량 

비 동기 식 동기 하 (비 동기 식 시 간일 치 ) 
Asynchronous Ti mi ng 

모선에서 어떤 사건의 발생이 이전 사 
건의 발생에 뒤따르거나 의존하는 기술 
비트 Bit 

2진수체계에서 수자 0혹은 1중의 어느 
하나를 나타낸다. 

선택기통로와 비교하시오. 

비 균일 기억 기 접근다중처리 장치 

Nonuniform Memory Access ( NUMA ) 
Mul 仕 processor 

기억기에 있는 단어에 대한 주어 진 처 
리장치의 접근시간이 기억기단어의 위 
치 에 따라 변하는 공유-기 억 기 다중처 리 
장치 

비휘발성기억기 Nonvolatile Memory 
그 기 억내용이 전원을 꺼도 변하지 않 
는 기억기 

人 

사용자등록기 User-Visible Register 
프로그람작성자가 참조할수 있는 CPU 
등록기. 명령모임형식은 하나 혹은 그 
이상의 등록기들이 연산수 혹은 연산수 
의 주소로 지정되는것을 허락한다. 
산수-론리연산장치 Arithmetic and Logic 
Unit(ALU) 

산수연산, 론리연산 그리 고 그것 들과 
관계되는 다른 연산들을 수행 하는 콤퓨 
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터의 한 부분 

선택기통로 Selector Channel 

한번에 하나의 I/O 장치만으로 동작하 
도록 설계된 I 八)통로기 . 일 단 I 八)장치 
가 선택되면 완료레코드가 한바이트씩 
전송된 다. 블로크다중통로，다중통로를 
참고 

순서회로 Sequential Circiut 

출구가 현재 입 구와 회 토의 상태 에 관계 
되는 수자론리회로. 따라서 순서회로는 
기억기의 속성을 가진다. 

슈 퍼 관 흐 를 처 리 장 치 Superpipelined 
Proccessor 

명 령관흐름이 많은 매 우 작은 단들로 
이루어 지도록 설계된 처리장치. 하나 
이 상의 관흐름단을 한박자주기동안에 
실 행할수 있 으며 많은 명 령 들이 갈은 
시간에 그 흐름선에 있을수 있다. 

슈 퍼 스 칼 라 처 리 장 치 Superscalar 
Proccessor 

다중명 령관흐름을 포함하도록 설계된 
처 리 장치 . 다중명 령 관흐름을 포함하도 
륵 설계된 처리장치. 하나이상의 명령 
을 동시에 갈은 관흐름단에서 실행할수 
있 다. 

실행주기 Execute Cycle 

CPU 가 명 령 조작코드에 의해 규정 된 
연산을 수행 하는 명 령주기의 한 부분 
새치기 Interrupt 

외부적 인 사건의 요구에 따라 현재 실 
행되고 있는 프로그람을 중지하고 외부 
적 인 사건요구를 수행하기 위한 콤퓨터 
처리의 한가지 방법 
새치기주기 Interrupt Cycle 

CPU 가 새 치 기 를 검 사하는 명 령 주기 의 
한부분. 만일 새치기가 가능하면 CPU 
는 현재프로그람상태 를 보존하고 새 치 
기 -조종기 루린에서 그 처리를 계 속하게 
한다. 

새치기구동식 I/O Interrupt-Driven I/O 
I 八) 의 한 형 태 . CPU 는 I/O 지 령 을 현 


시 하여 련속명 령실행 을 계 속하며 련속 
명 령 실 행 이 완료되 였 을 때 I/O 모둘에 
의하여 중단된다. 

天 

자기원판 Magnetic Disk 

자료를 기억할수 있는 단면 혹은 량면우 
에 자기적 인 표면층을 가진 두꺼운 원판 

자기511프 Magnetic Tape 

자기기록에 의해 자료를 기억할수 있는 
자기적인 표면층을 가진 레프 

자동첨수화방식 Autoindexing 

첨수등록기가 매 기 억기참조에서 자동 
적으로 증가하거 나 감소하는 첨수주소 
화방식 

자료모선 Data Bus 

자료전송을 위하여 리용되는 체계모선 
의 한 부분 

자료통신 Data Communication 

장치들사이에서의 자료전송. 이 말은 
주로 I 八)장치 인 경 우에 쓰인 다. 

자 유 접 근 기 억 기 Random-Access 
Memory ( RAM ) 

매 주소지정 가능위 치 가 동일한 주소지 
정기구를 가지는 기 억기 . 주어 진 위 치 
를 접근하는 시간은 선행접근순서와 무 
관계 하다. 

전역변수 Global Variable 

콤퓨터프로그람의 한 부분에서 정의되여 
다른 부분에서도 리용할수 있는 변수 

절대주소 Absolute Address 

어떤 중간참조가 없이 기억위치나 장치 
를 지적하는 콤퓨터언어에서의 주소 

정적 RAM Static RAM 

기 억세 포가 방아쇠 를 리용하여 실현된 
RAM . 정 적 RAM 은 전원 이 공급된 조 
건에 서만 자료를 유지한다. 주기 적 인 
재생이 필요 없다. 

조건쿄드 Condition Code 

다음연산결과에 영향을 주는 코드. 
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CPU 는 하나 혹은 여러개의 조건코드 
를 가질수 있다. CPU 내부에 따로 기 
억시킬수도 있고 보다 큰 조종등록기에 
기억시킬수도 있다. 

조종모선 Control Bus 

조종신호들의 전송을 위하여 리 용되 는 
체계모선의 한 부분 
조종등록기 Control Registers 

CPU 의 동작을 위 하여 리용되는 CPU 
등록기. 이 등록기들의 대부분은 사용 
자가 볼수 있다. 

조종기억기 Control Storage 

마이크로코드를 포함한 기억기의 한 부분 
조종장치 Control Unit 

ALU 연산, CPU 내부에서의 자료옮김， 
외부대면부(례하면 체계모선)를 통하여 
자료와 조종신호의 교환을 비롯한 CPU 
의 조작을 조종하는 CPU 의 한 부분 
조합회로 Combinational Circuit 

어떤 주어 진 순간의 출력값들이 그때 
의 입력값에만 의존하는 론리회로. 조 
합회 토는 기 억 가능성 이 없 는 순서 회 로 
의 특수경우이다. 

조건이행 Conditional Jump 

그것을 규정하는 명령이 실행되거나 규 
정된 조건이 만족될 때에만 일어 나는 
이행. 무조건이행과 반대의미를 가진다. 
조작3드 OPCode 

조작코드 (Operation Code) 를 나타내 
는 준말 

조작체계 Operating System 

프로그람의 집행을 조종하며 자원할당， 
순서짜기，입출력조종，자료관리와 갈은 
봉사를 제 공하는 쏘프트웨 어 
조작3드 Operation Code 

콤퓨터 의 연산을 표시하는데 리 용되 는 
코드. 보통 OP 코드로 간략화한다. 

주기억기 Main Memory 

명령들과 다른 자료를 순차실행 혹은 
처 리를 위하여 등록기 에 직접 넣을수 
있는 프로그람-주소지 정 가능기 억 기 


주소모선 Address Bus 

주소전송을 위해 리용되는 일부 체계모 
선. 일반적으로 주기억기주소나 I/O 장 
치를 지적 한다. 

주소공간 Address Space 

참조할수 있는 주소(기억기, I/O) 의 범 
위 이 다. 

주변 장치 Peripheral Equipment (IBM) 
콤퓨터체 계 에서 적 당한 처 리장치 가 외부 
와 통신을 할수 있게 하는 임의의 장치 
중앙처 리 장치 Central Processing 
Unit (CPU) 

명령을 꺼내여 실행하는 콤퓨터의 한 
부분. 이것은 산수-론리연산장치, 조종 
장치，등록기들로 구성되여 있다. 간단 
히 처리소자라고 한다. 

지우기가능한 빚디스크 Erasable Optical 
Disk 

광학기술을 리용한 디스크로서 쉽게 지 
우기 나 재 쓰기할수 있 는 디 스크. 3.25 
인치 와 5.25 인치디스크들이 리 용된다. 
대 표적 인 용 량은 650MB 이 다. 

직교성 Orthogonality 

두 변수 혹은 두 차원 이 서 로 독립인 
성질. 이 말은 명령모임의 전후관계에서 
일반적으로 명령의 다른 요소(주소방식, 
연산수개수, 연산수길이)들이 조작코드 
와 독립(조작코드에 의하여 결정 되 지 
않음)라는것을 가리키는데 리용된다. 
직접값주소 Immediate Address 

주소가 아니라 연산수의 값을 가지는 
주소부의 내용. 이것을 령-준위주소라 
고도 한다. 

직접접근 Direct Access 

자료의 물리 적위 치를 지적하는 주소들 
을 리용하여 상대적위치의 기억기에 차 
례 로 자료를 기 억 시 키 거 나 자료를 불러 
낼수 있는 능력 
직접주소 Direct Address 

연산수로 취급되는 자료가 들어 있는 
기억위치를 지적하는 주소 
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직접고 I억) I접근 Direct Memory Access ( DMA ) 
DMA 모둘이 라고 불리우는 특수한 모 
둘이 주기억 기 와 I/O 모둘사이 의 자료 
교환을 조종하는 입출력의 한 형식 
CPU 는 DMA 모둘에 자료블로크의 전 
송을 위한 요구신호를 보내 며 전체 블 
로크가 전송된후 새 치기 가 발생한다. 

진리값표 Truth Table 

모든 가능한 입력값들의 조합을 목록화 
하며 매 조합에 대하여 그 출력값을 지 
적 하여 론리 함수를 서술하는 표 

집적회로 Integrated Circuit ( IC ) 

전자구성요소들과 그것들이 호상 련결 
을 통합하여 놓은 규소와 갈은 고체물 
질의 소편 

大 

참조의 국부성 Locality of Reference 
짧은시간주기에서 반복적으로 갈은 묶 
음의 기 억기위치들을 접근하는 처 리장 
치의 경향 

첨수주소 Indexed Address 

콤퓨터명령의 실행전 혹은 실행동안에 
첨수등록기내용에 의하여 변경되는 주소 

첨수주소화 Indexing 

첨 수등록기 를 리 용하여 주소를 변경하 
는 기술 

첨수등록기 Index Register 

명령이 실행되는 동안 그 내용이 연산 
수주소를 변경시키는데 리용될수 있는 
등록기. 이 등록기는 계수기로 리용할 
수도 있다. 첨수등록기는 순환고리의 
실행을 조종하거나 표검색을 위하여 스 
위 치 토서 혹은 지 적 자로서 배 렬 리 용을 
조종하는데 쓸수 있다. 

처리장치 Processor 

를퓨터 에서 명 령을 해석 하고 실행하는 
기 능장치 . 처 리 장치 는 적 어 도 명 령 조종 
장치와 산수연산장치로 구성된다. 

처리장치주기시간 Processor Cycle Time 
가장 짧게 잘 정의된 CPU 마이크로조 


작에 요구되는 시간. 이것은 모든 CPU 
작용을 재 기 위 한 기 초시 간단위 이 다. 
기 계 주기 시 간이 라고도 한다. 

축적기 Accumulator 

단일주소명 령형식 에서 CPU 등록기의 이 
름. 축적기 혹은 AC 는 암시 적 으로 명 
령에서 두 연산자중 어 느 하나로 된다. 

체계모선 System Bus 

주요콤퓨터구성 요소 ( CPU , 기 억 기， 
I 八)) 들을 호상 련 결하는데 리용되 는 
모선 

ᄏ 

콤퓨터명령 Computer Instruction 
설계된 콤퓨터의 처 리 장치 가 인식할수 
있는 명령. 기계명령과 같은 말이다. 

콤퓨 터 명 령 모 임 Computer Instruction 
Set 

명 령연산수에 부여 되 여 있는 여 러 가지 
의미를 서술하는 를퓨터명령모임. 기계 
명령모임과 같은 말이다. 

클라스터(병렬 훅은 집합콤퓨터) Cluster 
하나의 콤퓨터처럼 느낄수 있게 단일한 
계산자원에 대하여 함께 작업하는 호상 
련결된 여러개의 콤퓨터들의 묶음 

캐 쉬 일 치 성 규 약 Cache Coherence 
Protocol 

모든 자료접근이 늘 주기억기 단어의 내 
용중에서 가장 최근의것을 요구하도록 
여러개의 캐쉬중에 자료유효성을 보존 
하는 기 구 

캐쉬행 Cache Line 

캐쉬꼬리표와 관련되는 자료블 로크， 캐 
쉬와 기억기사이의 전송단위 

캐쉬기억기 Cache Memory 

특수한 완충기억기. 이것은 처리장치에 
의하여 다음에 요구하거 나 주기억기로 
부터 자동적으로 엄 게 되는 주기억기 안 
의 자료나 명령을 복사，보관，유지하는 
데 리 용되 는 주기억 기 보다 더 작고 더 
빠른 완충기 억기 이 다. 
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탄창 Stack 

복귀되는 다음항이 제일 마지막에 기억 
된 항이 되도록 구성하고 유지하는 목록. 
후입 선출목록 ( LIFO ) 이 라고도 한다. 

투기실행 Speculative Execution 

분기중 어느 한 경로에 따르는 명령들 
의 실행. 이 분기가 일어 나지 않았다 
는것이 후에 판명되면 투기실행결과는 
무시된다. 

n 

폄웨어 Firmware 

ROM 에 기 억된 마이크로코드 
프로그람계수기 Program Counter 
명 령 주소등록기 

프로그람식론리배렬 Programmable 
Logic Array ( PLA ) 

그것 들의 호상련결 이 특별 한 론리함수 
기능을 수행하는 프로그람일수 있는 문 
회로들의 배렬 

프로그람식 읽 기전용기 억기 Programmable 
Read-Only Memory ( PROM ) 

내 용을 오직 한번만 설정할수 있는 반 
도체기 억기 . 쓰기처 리는 전기적으로 수 
행되며 사용자는 초기소편을 만든후에 
한번만 쓰기를 할수 있다. 

프로그람식 I/O Programmed I/O 

CPU 가 I/O 모둘에 I/O 지 령 을 출력 하 
고 그다음 그 조작이 진행되기전에 완 
료되기를 대기해 야 하는 입출력의 한 
형식 

프 로 그 람 상 태 단 어 Program Status 
Word ( PSW ) 

명령이 실행되는 순서를 지적하며 콤퓨 
터 체 계의 상태 를 보존하고 지 적하는데 
리용되는 기억기령역 . 처리장치상태단 
어라고도 한다. 

프로쎄스 Process 

집 행중의 프로그람. 프로쎄스는 조작체 


계에 의해 조종되며 순서가 결정된다. 
프로쎄스조종 M 로크 Process Control 
Block 

조작체계에서 프로쎄스의 상태표시. 이 
것은 프로쎄스의 특성과 상태 에 대 한 
정보를 포함하고 있는 자료구조이다. 

퍼I지 Page 

가상기 억기체계 에서 가상주소를 가지 고 
실지기 억기 와 보조기억기 사이 장치 로 
전송되는 고정길이블로크. 

페지오유 Page Fault 

참조단어 를 가지 는 페 지 가 주기억 기 에 
없는 경우 발생한다. 이것 은 새 치 기를 
발생시켜 조작체계가 요구하는 페지로 
가져 올것을 요구한다. 

페지틀 Page Frame 

폐지를 보관하는데 리 용되는 주기억 기 
의 령역 


허용된 새치기 Enabled Interrupt 
CPU 를 조작하여 규정된 준위의 새 치 
기요구를 허락하는 조건 또는 상태 
해신기 Decoder 

몇개의 입구신호와 여러개의 출구신호 
선을 가진 소자. 출구와 입구 신호조합 
사이에는 1 대 1 대 응관계 가 있다. 

핵심 Nucleus 

기본적이며 가장 자주 리용되는 기능을 
가진 조작체계의 부분. 보통 핵심은 주 
기억기에 상주한다. 

휘발성기억기 Volatile Memory 
기 억 기 내용을 유지 하기 위해 직 류전원 
이 요구되는 기억기 . 전원이 차단되면 
기 억된 정보를 잃어 버린다. 

n 

꺼내기주기 Fetch Cycle 

CPU 가 실 행하려 고 하는 명 령 을 기 억 
기로부터 꺼내는 명령주기의 한 부분 
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o 

아 쎔 ■ 리 언 어 ( 기 호 언 어 ) Assembly 
Language 

일반적으로 그 명령들이 콤퓨터명령과 
1:1 로 대응되며 마크로명 령과 같은 명 
령 을 리 용할수 있 는 콤퓨터 지향언 어 . 
를퓨터-의존언어라고도 한다. 

완충기 Buffer 

한 장치에서 다른 장치에로 자료를 전 
송할 때 자료흐름의 속도나 사건발생시 
간의 차이 를 맞추기 위하여 리용되 는 
기억기 

연산수 Operand 

연산을 수행 하는 기능실체 

요구페지화 Demand Paging 

필요한 순간에 보조기억기로부터 실지 
기 억기 에 로 페지전송 

오유수정3드 Error-Correcting Code 
매개 문자 혹은 신호를 규정된 코드구 
성규칙 에 맞춘 코드. 이 규칙을 리용하 
여 오유의 검출과 검출된 오유의 일부 
혹은 전부를 자동적 으로 수정 한다. 

오유검사쿄드 Error-Detecting Code 
매개 문자 혹은 신호를 규정된 코드구 
성규칙 에 맞춘 코드. 이 규칙을 리용하 
여 오유검출을 진행한다. 

일반등록기 General-Purpose Register 
등록기묶음안에서 늘 명시적으로 주소 
화할수 있는 등록기. 이것은 여러가지 
목적 에 쓸수 있 다 (례 를 들면 축적기， 
첨수등록기，자료에 대한 특수한 조종 
자로 쓸수 있다). 

입 출력 Input-output ( I / O ) 

입력이나 출력 혹은 둘다를 의미. 콤퓨터 
와 그에 직접 련결된 주변장치사이에서 
자료의 입출력을 의미하는 경우가 많다. 

읽기전용기억기 Read-Only Memory ( ROM ) 
그 내용을 기억기가 파괴되지 않는 한 
교체 할수 없는 기억 기. 지 울수 없는 기 
억 기 


예측실행 Predicated Execution 

개별명령들의 조건실행을 지원하는 기 
구. 이것은 분기명령의 두 갈래에 대한 
실행이 투기적으로 가능하게 하며 결국 
취해 진 분기결과를 보존하게 한다. 

* * * 

1 의 보 수 표 현 Ones Complement 

Representation 

2 진수등록기 들을 표시하는데 리 용된 다. 
정의 옹근수는 부호-크기표현법으로 표 
시된다. 부의 옹근수는 갈은 크기의 정 
의 옹근수표현에서 매 비트를 반전시켜 
표시 한다. 

2 의 보수표현 Twos Complement 

Representation 

2 진옹근수를 표시 하는데 리 용. 정 의 옹 
근수는 부호-크기표현법으로 표시된다. 
부수는 그 수의 1 의 보수표시 에 1 을 
더하여 표시한다. 

2 진연산자 Binary Operator 

두개의 연산수에 대 한 연산을 표현하는 
연산자 

* * * 

ASCII 

정 보교환을 위한 미 국표준코드. ASCII 
는 수자，영 문자，특수한 인쇄문자들에 
리용되는 7 bit 코드이다. 또한 인쇄나 
표시는 되지 않지만 일부 특수한 조종 
기능을 수행하는 조종문자들에 대한 코 
드들도 포함한다. 

CD-ROM 

읽기만을 할수 있는 빛소형디스크를 말 
한다. 를퓨터 자료를 기 억 시 키 기 위 하여 
리용되는 지울수 없는 디스크이 다. 표 
준체계는 12 Cm 원판으로 되여 있으며 
550 Mbyte 이 상을 기 억 시 킬수 있 다. 
G :10 억 을 의 미하는 앞붙이 
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I/O 통로 I/O Channel 
섬세한 1/ ◦조작에서 CPU 의 부담을 덜 
어 주는 상대적 으로 복잡한 I/O 모둘. 
I/O 통로는 CPU 참가를 요구하지 않고 
주기억기로부터 I 八)지령렬을 실행한다. 

I/O 모듈 I/O Module 
콤퓨터의 주요구성부분의 하나. 하나 
혹은 그이상의 외부장치(주변장치)의 
조종과 그 장치 들과 주기억기 혹은 
CPU 등록기 들사이 자료교환에 리용할 
수 있다. 

I/O 조종기 I/O Controller 
CPU 나 I/O 통로로부터 세 부적 인 조종 
을 요구하는 상대 적 으로 단순한 I/O 모 
둘. 장치조종기 라고도 한다. 

I/O 처리장치 I/O Processor 

그자체의 전용 I/O 명령 혹은 일부 경 


우에 일 반등록기의 기계명 령 을 실행할 
수 있는 자체 처 리 장치 를 가진 I 八)모둘 
K ： 2 10 =1024 인 앞 붙 이 . 따 라 서 
2 Kb =2046 bit 이다. 

M ： 2抑=104採76 을 의 미 하는 앞붙이 . 따라 
서 2 Kb =2_220 bit 이 다. 

WORM 

쓰기-한번 읽 기-여 러번을 의 미한다. 
한번-복사 ( single - copy ) 디스크를 상품 
화함으로써 CD-ROM 보다 더 쉽게 쓰 
기할수 있게 된 디 스크. 쓰기 조작이 한 
번 수행된후에는 CD-ROM 과 같이 읽 
기만 할수 있다. 가장 일반적인 크기는 
5.25 inch 로서 자료를 200〜 800 Mbyte 
보존할수 있다. 
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533 

단일명령, 단일자료흐- 

533 

단조고속완충기 넘기 111 
단조기억접근 553 

덜기연산 245-271 

도형기호 574 

동기계수기 601-603 

동기동적기억기 117〜122 
동기식 S-R 방아쇠 599 
동기신호 61 

동적 RAM 116-122 
드 모르간정리 573-577, 
583, 605 

등록기 6-25, 350-351 
등록기조직 354-377 

등록기이■바꾸기 434〜 

451 

등록기주소화 327-335 

등록부규약 546 
등각속도 148 
등선속도 148 

D 방아쇠 598〜599 



디스크구동 159〜197 
디스크모임 135〜137 

대규모집적소자 35 
대규모집적회로 34 
대기중의 처리상태 210 
대면부조종다리 70〜71 
대수적표기법 574 
대칭다중처리 소자 539 
대칭다중처리 소자 545 
대형대칭다중처리소자콤퓨터 
540 

ᄅ 

량면디스크 135 

련상기억기 105〜124 

련상배치(넘기기) 101〜 

124 

련속마당모의 556 

렬주소선택 90-121 

렬주소선택신호 91〜121 
론리명령 282 
론리밀기 283 

론리연산 282-303 
론리주소 217〜233 
류점수 234〜262 
류점수연산 268〜272 

램바스 DRAM 119 

레이드 132〜139 

레이드권고회의 152 

□ 

마이크로명령 440〜491 
마이크로명령 모선 440〜 

491 

마이크로명령 순서 500- 
512 

마이크로명령스펙트르 

505〜514 


마이크로명령 실행 505- 
514 

마이크로명령 주소생성 519 
마이크로연산 478, 481- 
489 

마이크로 프로 그람 실현 491 
마이크로프로그람 언어 492 
마이크로 프로 그람 응용 528 
마이크로 프로 그람 정의 504 
마이크로 프로 그람 조종 500 
마이크로프로그람조종장치 
490， 493 
망접속 59 
명령길이 324-339 
명령관흐름처리 350 
명령등록기 23〜24, 280〜 
359 

명령해신 361 
명령모임 24-43 
명령창문 434-435 

명령미리꺼내기 360 

명령형식 324〜337 

명령조작해신 358 
명령주기쿄드 476 
명령주소계산 51 
명령준위병렬화 425-432 
명령완충등록기 23 
명령종류 24〜43 
명령꺼내기 46-53 
모선설계요소 64 
모선조종기 65〜75 
모선주기 64-78 
모선중재 70-75 
모선요구 61-78 
모선허가 61 
모선호상접속 60-61 
모의계획 60 
모듈 280-297 


무조건분기 24 

문 574 

문회로지연 〜576 

물리적전용화 250 
물리주소 217 
물리주소확장 374 
미리참조(주소)화 338 
미리해신 450-451 
미소전자공학 20 
밀기등록기 599-601 
밀도 133〜153 
모으기 216 
맥동계수기 602 
ᄇ 

박자 45-79 
박자주기 65-78 

박편，규소 29 
반도체기억기 32-121 
반도체주기억기 86 
반련상기억배치 108〜122 
방식적속성 10 
방향기발 372 
변환기 157〜159 
변환엿보기 완충기 220- 
222 

병렬등록기 599-600 
병렬처리 531-559 
병렬처리장치 533-559 
보호 방식가상새치기 374 
보호허락기발 373 
본문자료 211 
불대수학 572-575 
불방정식 582-584, 605 
부의 자리내림넘침 259 
부의 자리올림넘침 259 
부정론리 242，262 
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부정연산 292 
부호-크기표현 237〜257 

분구 134〜154 
분기 350 
분기목표 365 
분기명령 282-296 
분기 예측 37-40, 365- 
385， 436〜437 
분할 232 
M 로크 133〜154 
M 로크형식 149 
비공유 551 

비 균일기억기접근 531〜 

553 

비토막비페 지기 억기 223 
비 토막페 지화기억기 224 

배렬처리 533-562 

배치기능 101 
백토르계산 556-568 

백토르새치기 172 
백토르처리소자 562 

人 

산수-론리 연산장치 436- 
453 

산수밀기연산 24 

산수연산명령 282-292 
상대주소화 328〜348 

상태, 처리공정조종를로크 

210〜211 

상품화된 콤퓨터 25 
상주감시 프로그람 203 
선크기 108 
선택기통로 195 
성능 81〜131 
성능계수기가능 374〜375 
소규모집적소자 29 
소편 88 


소편당 한비트조직 122 
소편론리 89 

수자론리 572-592 

수자식 비 데오디스크 150〜 

152 

수자장치회사 26-42 
수직 마이크로명령 495 
수평 마이 크로명 령 493 

순서회로 596-604 

순차접근 82 
슈퍼콤퓨터 556-557 

슈퍼스칼라실행 43 
슈퍼 스칼라처 리 소자 425 

-521 

시간다중화방식 64 
실행명령 462 

실행주기 24-49, 359, 
470〜475 

새치기 구동입출구 155 
새치기단자 70-71 
새치기응답 ( ACK ) 61 
새치기조종기 53 

새치기주기 359, 474 

새치기허가기발 372 
天 

자기(자성)면기억기 83 

자기빚디스크 131〜151 
자기디스크 132 
자기레프 151 
자두 134〜152 
자료조직 133 
자료단자 69 
자료등록71 353〜356 
자료모선폭 35, 61 
자료밀도 1況〜136 
자료선 45, 61-74 
자료연산 52, 57 


자료이동 12 
자료완충기 191 
자료보관 1，29 
자료처리 11-13 
자료동로 19〜28 
자료틍신 12 
자료흐— 358-359 
자료흐름분석 37, 40 
자료꺼내기 352 
자료쓰기 251，236 
자리길 133 

자리넘침 235-247, 258- 
271 

자유접근 81-87 

자유접근기억기 82-87 
작은 마무리처리장치 278 

긴시간대기렬 212-214 
장치오유 44-47, 93 

전기소거형프로그람가능한 
읽기전용기억기 87〜 

88 

전송속도 83 
전송시간 136〜137 
전송응답 61 
절차 297 
절차접근명령 297 
절대값연산 292 
정의 아래자리넘침 258 
정의 웃자리넘침 258 
정적람 82，110 
조건분기 24 
조건분기명령 361-386 
조건3드 351〜354, 370〜 
378 

조작체계의 ACM 특수그룹 

화 231 
조종 45-75 
조종신호 45-61 
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조종기억기 491〜494 

조종론리 157 

조종 및 상태등록기 350 

〜355 

조종장치 351-352 
조종장치조작 469〜470 
조종주소등록기 494-496, 
506， 515,532 
조종단어 492〜530 
주기밀기조작 294 
주기조종기 193 
주기흠침 176，195 
주소단자 69 
주소화 103 
주소등록기 353〜360 
주소변경명령 24, 25 
주소선 90〜93, 100, 116 
주소화방식 324〜329 
주변 116 

주변요소 호상 접속 118 
주변장치 115〜181 
중간일정작성 204〜210 
중앙처리장치 13-14 
중재단자 70 
직접주소화 327-339 
지수부아래로 자리넘침 
262 

지수부우에로 자리넘침 

261 

지연분기 368 

지울수 있는 빚디스크 

150 

지울수 없는 디스크 147 
직접접근 82 
직접기억접근 176 
직접배치 102 

직접주소화 327〜339 

집적회로 28 


大 

참조의 국부성 85 

첨수주소화 328-329 
첨수등록기 334-346 

축적기와 급하기상등록기 

15 

처리장치 15, 58 
처리장치조직 351 
처리장치-기억기 49 
처리장치-입출력장치 49 
축소명령모임 콤퓨터 284 
축소명령콤퓨터 284 
축소명령콤퓨터체계명령준 
위병렬 388-421 
축적기와 급하는수/상등록 
기 24 

체계단자 69 
체계모선 60 
체계프로그람 26 
체계조종명령 295 
체계호상접속 13 
ᄏ 

칸도표 

콤파일러기준등록기최적화 

397 

콤퓨터조직부분 18 
콤퓨터구조 13, 18 
콤퓨터기능 1，48 
콤퓨터조직방식 1〜18 
콤퓨터기 억기체계 81-85, 
93 

콤퓨터의 발전과 성능 19 

〜 20 

콤퓨터산수연산 235, 270 
콤퓨터세대 26 

클라스터 531-536 
캐쉬기억기 8卜85, 99~ 


125 

캐쉬 DRAM 117 

캐쉬불가능 373-374 
캐쉬일치 NUMA 553-556 
캐쉬일치성 531-532, 543 
〜544， 552-553 


탄창주소화 330-331 
탄창지시기 330-340 
탄창프레임 333-345 
탐색시간 136〜144 
토막번호 222-228 
토막지시기 350-353 
토막비페 지화기억 기 223 
토막페 지화기억 기 223 
토막화 198〜227 
특권요구준위 224-225 
틀프레임 217-231 


프로그람계수기 23, 350〜 

359 

프로그람 ROM 87-88 
프로그람상 태 단어 350〜 

355 

프로그람실행 48-55 
프로그람식입출력장치 

155〜164, 176〜179, 
195 

프로 쎄스 조종 블 로크 210 

페지 217-233 
페지오유 219-231 
페지크기확장 374 
페지표 217-233 
페지표구조 219-220 
페지화 198〜233，373 
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o 

하드웨어배선론리식조종장 

치 500 

하드웨어 프로그람 47 
하밍부호 95 

한번쓰기-읽기전용기억기 

149〜150 

한소편캐쉬 80 
호상접속구조 76 
접근시간 117〜130 
후입선출대기렬 330 

확장형 373-374 

ᄁ 

꺼내기중첩 360 
ᄍ 

짧은시간일 정작성 209〜 

231 

ᆻ 

쓰기불가능 373 

O 

아래자리넘침 235-275 

아쎔블리언어 310 


연산수계산 362 
연산수꺼내기 362 
연산수쓰기 362 
엿보기규약 545-548 
오유검사 161〜162 
오유수정부호 94-95 
오유통보단자 69-70 
옹근수산수연산 238 
옹근수표현 296 
용량 80-81 
웃자리넘침 235-262 
웃방향호환성 25-31 
유연성자기원판 135〜137 
유효주소 325-328 
일감 202〜232 
일감조종언어 204 
일반등록기 353-385 
일치검사 372 
일치금지 373 
읽기-변경-쓰기조작 66 
읽기전용기억기 83-88 
읽기/통보할당 608 
읽기후쓰기 68 
외부기억기 132 
외부대면부 181 


외부장치 157〜165 
원천부호기 510 
원체스터디스크 136 
월크스조종 495 
원천연산수참조 280 
의사명령 309 


I/O 12 
I/O 기능 48 
I/O 대기 49 

I/O 로부터 처리소자까지의 

전송자 49, 60 
162-171 
I/O 쓰기 61，效 
I/O 명령 166，282 

I/O 상태정보 162〜189 
I/O 기능 156-178 
I/O 읽기 159 
I/O 조종기/장치조종기 164 
I/O 주소등록기 48 
I/O 통로 178〜180 
I/O 특권기발 372 
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략 어 


ALU 산수-론리연산장치 

ASCII 정 보교환용미국표준코드 

ANSI 미 국국가표준협 회 

BCD 2 진식 10 진부호 

CD 고밀도디스크 

CD-ROM 고밀 도디 스크-읽 기 전용기 억 기 

CPU 중앙처 리 장치 

CISC 복합명 령모임 콤퓨터 

DRAM 동적 자유기 억 기 

DMA 직 접 기 억 기 접 근 

EPIC 명 시 적 병 렬 명 령 계 산 

EPROM 지 우기 가능프로그람읽 기 전용기 억기 

EEPROM 명시적 인 지우기 가능프로그람읽기전용기 억기 

HLL 고급언어 

VO 입력/출력 

IAR 명 령 주소등록기 

1C 집적회로 

IEEE 국제 전기 전 자기 술자협 회 

ILP 명 령 준위 병 렬 화 

IR 명 령 등록기 

LRU 가장최 근리용 

LSI 대 규모집 적 회 로 

MAR 기 억 기 주소등록기 

MBR 기 억 기 완충등록기 

MESI 변경-독점-공유-무효 

MMU 기억기관리단위 

MSI 중규모집 적 회 로 

NUMA 비 균일 기 억 기 접 근 

PC 프로그람계수기 

PCI 주변장치호상접 속 

PROM 프로그람식읽 기 전용기 억 기 

PSW 처 리 장치상태단어 

PCB 독립디 스크들의 여 유배 렬 

RALU 등록기 /산수-론리 연산장치 

RAM 자유기 억 기 

RISC 축소명 령모임 콤퓨터 

ROM 읽 기 전용기 억기 

SCSI 작은 콤퓨터체계대면부 

SMP 대 칭 다중처 리 장치 

SRAM 정 적 자유기 억 기 

SSI 소규모집 적 회 로 

VLSI 초대 규모집 적 회 로 

VLWI 매 우 긴 명 령단어 

WORM 쓰기 -한번 읽 기 -여 러 번 
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